التعرف على الكلمات المعزولة

Σχετικά έγγραφα
بحيث ان فانه عندما x x 0 < δ لدينا فان

Ακαδημαϊκός Λόγος Εισαγωγή

تحسين أنظمة التعرف عمى الكالم عن طريق جمع خوارزميتين الستخالص السمات

)الجزء األول( محتوى الدرس الددراتالمنتظرة

)Decisions under certainty(

( ) ( ) ( ) ( ) v n ( ) ( ) ( ) = 2. 1 فان p. + r بحيث r = 2 M بحيث. n n u M. m بحيث. n n u = u q. 1 un A- تذآير. حسابية خاصية r

Εμπορική αλληλογραφία Παραγγελία

Tronc CS Calcul trigonométrique Cours complet : Cr1A Page : 1/6

األستاذ: بنموسى محمد ثانوية: عمر بن عبد العزيز المستوى: 1 علوم رياضية

الجزء الثاني استعمال المتغي ارت الصورية في النموذج القياسي االقتصادي - تعريف المتغيرات الصورية: غالبا ما يعرب عن ىذا النوع من ادلتغريات ب

جامعة قاصدي مرباح ورقلة كلية الرياضيات وعلو المادة قسم الفيزياء ميداف : علو المادة تخصص : فيزياء المواد من إعداد : بن الضب ىاجر بعنواف

تمارين توازن جسم خاضع لقوتين الحل

األصوات فوق القطعية ومكانها فى فهم القرآن الكريم

Engineering Economy. Week 12

مقومات تطبيق ستة سيجما في تحسين أداء المشروع

- سلسلة -2. f ( x)= 2+ln x ثم اعط تأويل هندسيا لهاتين النتيجتين. ) 2 ثم استنتج تغيرات الدالة مع محور الفاصيل. ) 0,5

تصميم مجموعة ضبطية غير E O 1 X O 2 K O 3 O 4

( ) [ ] الدوران. M يحول r B و A ABC. 0 2 α فان C ABC ABC. r O α دورانا أو بالرمز. بالدوران r نكتب -* النقطة ' M إلى مثال لتكن أنشي 'A الجواب و 'B

تأثير البيئة اللونية داخل المتجر على نية تحقيق الشراء اإلندفاعي عند المستهلكيػنػ الجزائرييػػػػن -تطبيق نموذج

أسئلة استرشادية لنهاية الفصل الدراسي الثاني في مادة الميكانيكا للصف الثاني الثانوي العلمي للعام الدراسي

ظاهرة دوبلر لحركة المصدر مقتربا أو مبتعدا عن المستمع (.

الباب الثالث البحث ختتار الباحثة مكان البحث و ىو ادلدرسة الثانوية للباحثة يف البحث عن البيانات و من ناحية أخرى ىذه ادلدرسة كانت

( ) ( ) ( ) ( ) ( )( ) z : = 4 = 1+ و C. z z a z b z c B ; A و و B ; A B', A' z B ' i 3

الموضوع الكفاءة اإلنتاجية و دورها في إختيار اإلستراتيجيةالتنافسية للمؤسسة الصناعية دراسةحالة مؤسسة صناعةالكوابل بسكرة

يط... األعداد المركبة هذه التمارين مقترحة من دورات البكالوريا من 8002 إلى التمرين 0: دورة جوان 8009 الموضوع األول التمرين 8: دورة جوان

Volume 5(1), January 2018

تقييم أثر االداء المالي والنقدي على التضخم النقدي في الجزائر دراسة قياسية- طهراوي فريد

مقدمة: التحليل الخاص باإلنتاج والتكاليف يجيب عن األسئلة المتعلقة باإلنتاج الكميات المنتجة واألرباح وما إلى ذلك.

الجزء الثاني: "جسد المسيح الواحد" "الجسد الواحد )الكنيسة(" = "جماعة المؤمنين".

1/ الزوايا: المتت امة المتكاملة المتجاورة

Contents مقدمة. iii. vii. xxi

توازن الذخل المومي الفصل الرابع أ. مروه السلمي

( ) ( ) ( ) = ( 1)( 2)( 3)( 4) ( ) C f. f x = x+ A الا نشطة تمرين 1 تمرين تمرين = f x x x د - تمرين 4. نعتبر f x x x x x تعريف.

تايضاير و مولع يئاهن Version 1.1 اي ل

الدور المحوري لسعر الفائدة: يشكل حلقة وصل بين سوقي السلع والنقود حيث يتحدد سعر الفائدة في سوق

مرونات الطلب والعرض. العراق- الجامعة المستنصرية

( D) .( ) ( ) ( ) ( ) ( ) ( ) الا سقاط M ( ) ( ) M على ( D) النقطة تعريف مع المستقيم الموازي للمستقيم على M ملاحظة: إذا آانت على أ- تعريف المستقيم ) (

المادة المستوى المو سسة والكيمياء الفيزياء تمارة = C ت.ع : éq éq ] éq ph

فاعلية السقاالت التعليمية في تدريس العلوم على تنمية التحصيل الدراسي لدى تلميذات المرحلة المتوسطة

( ) / ( ) ( ) على. لتكن F دالة أصلية للدالة f على. I الدالة الا صلية للدالة f على I والتي تنعدم في I a حيث و G دالة أصلية للدالة حيث F ملاحظات ملاحظات

التمرين األول: )80 نقاط( - 1 أ- إيجاد الصيغ نصف المفصلة للمركبات:. M 1 D C B A 3,75 B: CH 3 CH 2 CH 3 C CH 3 A: CH 3. C: CH 3 CH CH 3 Cl CH CH CH 3

عرض المنشأة في األجل القصير الفصل العاشر

الباب الثالث 1. مكان البحث الرموز الربيدم مجتمع البحث 3. عينة البحث الفصل IPA D بكونو فئة ضابطة.

( ) تعريف. الزوج α أنشطة. لتكن ) α ملاحظة خاصية 4 -الصمود ليكن خاصية. تمرين حدد α و β حيث G مرجح

Le travail et l'énergie potentielle.

عولي 2: قوانين كبلز الهدف مقدمة الخطوات حتقيق قواننيكبلر باستخدام مدار مركبة فضائية تدور حول القمر وإجيادكتلة قمر.

١٤ أغسطس ٢٠١٧ العمليات الحسابية الا ساسية مع الا شع ة ٢ ٥

عرض وتحليل ومناقشت النتائج 1 -عرض وتحليل النتائج الخاصة بالفرضية االولى: تطبيق عوامل األمن والسالمة المتعلقة بالطلبة اثناء ممارسة النشاط البدني

[ ] [ ] ( ) ( ) ( ) ( ) ( ) I و O B بالنسبة ل AC) ( IO) ( بالنسبة C و S M M 1 -أنشطة: ليكن ABCD معين مرآزه O و I و J منتصفي

امتحان هناية الفصل الدراسي الثاني ـ الدور األول ـ العام الدراسي 1024 / 1023 م

P. Benameur nabil مفهوم املنفعة املنفعة الكلية واملنفعة احلدية. توازن املستهلك. التبادل. اشتقاق منحىن الطلب. األثر االحاليل واألثر الدخلي.

تصحيح تمارين تطبيقات توازن جسم صلب خاضع لقوتين

التمرين الثاني )3 2-( نعتبر في المستوى المنسوب إلى معلم متعامد ممنظم التي معادلتها : 3-( بين أن المستوى مماس للفلكة في النقطة.

آثار سياسة التشغيل على التنمية المستدامة في الجزائر

( ) ( ) ( ) ( ) تمرين 03 : أ- أنشيء. ب- أحسب ) x f ( بدلالة. ب- أحسب ) x g ( تعريف : 1 = x. 1 = x = + x 2 = + من x بحيث : لتكن لكل. لكل x من.

ق ارءة ارفدة في نظرية القياس ( أ )

Al-Azhar University - Gaza. Laser Physics. Lecture 7

دراسة ومحاكاة رادارات الفتحة التركيبية وطرق التشويش عليها الجمهورية العربية السورية المعهد العالي للعلوم التطبيقية والتكنولوجيا قسم االتصاالت

1- عرض وتحليل النتائج الفرضية األولى: يبين مقارنة بين األوساط الحسابية واالنح ارفات المعيارية وقيمتي )T(

أهداف التجربة: األجهزة واألدوات:

OH H O CH 3 CH 2 O C 2 H a = - 2 m/s 2. 2 gr(1 cos θ) max 1/5

الترقيم الدولي المعياري للدوريات

() 1. ( t) ( ) U du RC RC dt. t A Be E Ee E e U = E = 12V ن ن = + =A ن 1 RC. τ = RC = ن

- سلسلة -3 ترين : 1 حل التمرين : 1 [ 0,+ [ f ( x)=ln( x+1+ x 2 +2 x) بما يلي : وليكن (C) منحناها في معلم متعامد ممنظم

أثر طريقتي التعامل مع القيم املفقودة القدرة على دقة تقدير معامل الفقرات واألفراد

مادة الرياضيات 3AC أهم فقرات الدرس (1 تعريف : نعتبر لدينا. x y إذن

أحواض الترسيب األولية

3as.ency-education.com

أطروحة مقدمة لنيل شهادة دكتىراه في العلىم

Laser Physics. The Einstein Relation. Lecture 5. The Einstein Relation 28/10/1431. Physics Academy

مذكػػػػػػػػػػػػػرة نػػػػػػػػػػػػاصف هػػػػػػػػػػػػدى سػػػػػػػػػارة فطريات سبخة: ادلقػػاومة األمسوزيػػػػة لفطر

وزارة التربية التوجيه العام للرياضيات العام الدراسي 2011 / 2010 أسئلة متابعة الصف التاسع الكتاب األول

بسم اهلل الرمحن الرحيم

تمرين 1. f و. 2 f x الجواب. ليكن x إذن. 2 2x + 1 لدينا 4 = 1 2 أ - نتمم الجدول. g( x) ليكن إذن

مطياف الكتلة Mass Spectrometer

المحاضرة السابعة والثامنة

ادللخص اللغة اؼباليوية كىي ال تؤثر يف النظا اؼبقطعي لتلك األلفاظ. كتظهر أمهية الدراسة يف أهنا تساعديف

=fi Í à ÿ ^ = È ã à ÿ ^ = á _ n a f = 2 k ÿ ^ = È v 2 ح حم م د ف ه د ع ب د ا ل ع ز ي ز ا ل ف ر ي ح, ه ف ه ر س ة م ك ت ب ة ا مل ل ك ف ه د ا ل و

Phonétique Transcription 1 -علم الا صوات اللغوية ووظيفته

جامعة دمشق كلية الهندسة المدنية قسم الهندسة الجيوتكنيكية ميكانيك التربة 1 د.م.عبد الرحمن المنصوري المحاضرة األولى

المحاضرة 15 التحليل األولي للقياسات اهليدرولوجية

الفصل األول : التيار الكهربائي واملقاومة

فيزياء نووية 481 فيز

مبادئ أساسية في الفيزياء الذرية والفيزياء النووية Fundamental principles in the atomic physics, and the nuclear physics

ر ک ش ل ن س ح ن د م ح م ب ن ی ز ن. ل و ئ س م ه د ن س ی و ن ( ی ر ک ش ل &

بإشراف : الدكتور أمحد ساهر سلطان


دور املؤثرات السياقية يف تقدير املدى الزمني للفونيم: دراسة فونولوجية حاسوبية

الكيمياء الالعضوية المرحلة االولى 2017

قوانين التشكيل 9 الةي ر السام ظزري 11/12/2016 د. أسمهان خضور سنستعمل الرمز (T,E) عوضا عن قولنا إن T قانون تشكيل داخلي يعرف على المجموعة E

( ) ( ) ( ) - I أنشطة تمرين 4. و لتكن f تمرين 2 لتكن 1- زوجية دالة لكل تمرين 3 لتكن. g g. = x+ x مصغورة بالعدد 2 على I تذآير و اضافات دالة زوجية

أساسيات لغة QBASIC A B A + B A B A ^ B A = B A B المعامالت الحسابية: + - * / \ ^ المعامالت المنطقية: AND OR NOT

Gabor إ ازلة الضجيج من هذه الصور وزيادة تباينها. في المرحلة الثانية تم تطبيق تقانة قطع الرسم البياني Graph-cut من

حركة دوران جسم صلب حول محور ثابت

. Conservation of Energy

جامعة قاصدي مرباح ورقمة الج ازئر كمية العموم االقتصادية والعموم التجارية وعموم التسيير- قسم العموم التجارية بعنوان:

ثناي ي القطبRL (V ) I (A) 0,1 0,2 0,3 0,4 0,5 0,6

األستاذ محمد عثمان

مجلة اتحاد الجامعات العربية للتربية وعلم النفس...المجلد الثاني عشر - العدد الثالث 4102

مطياف الكتلة. Mass Spectrometer بأشراف الدكتورة زينب طارق - هشام أمحد جواد(

Transcript:

جامعة تشرين كلية الهندسة المعلوماتية قسم البرمجيات ونظم المعلومات السنة الخامسة التعرف على الكلمات المعزولة Isolated word recognition )مشروع تخرج( إعداد الطالب : مرهج ابراهيم ذوالفقار حامد أحمد غدير بإشراف د.م : بش ار ابراهيم محمد العا الدراسي : 2015-2016

مقدمة أصبحت نظم التعرؼ على الكال جزءا ال يتجزأ من علو احلاسب دلا ػلملو الكال من معلومات وألعلية الكال يف التفاعل ب ت والبشر وزلاولة تأم ت طرؽ جديدة للتفاعل مع احلاسب ويف حبثنا ىذا قمنا ببناء نظا للتعرؼ على الكلمات ادلعزولة لتمييز األرقا االنكليزية وذلك لفهرسة بعض أوامر احلاسب شلا يساعد مرضى الشلل الرباعي يف التفاعل مع احلاسب. يف البداية احتجنا إىل صبع بيانات التدريب من ادلتطوع ت حيث سبكنا من صبع 2000 عينة صوتية من 20 شخص وبعد ذلك قمنا دبعاجلة ىذه البيانات للتخلص من بعض الضجيج الذي ربتويو ولتصبح السمات ادلستخرجة منها أكثر فعالية يف سبييز الكلمات حيث استخدمنا تقنية Mel Frequency Cepstral Coefficients(MFCC) الستخراج 12 شليز لكل إشارة مث نقو بفهرسة ىذه السمات وعنقدهتا باستخدا ما يسمي بالتكميم الشعاعي للحصوؿ فهرس Code Book مؤلف من 130 عنقود والذي يستخد خرجو كدخل لنموذج ماركوؼ ادلخفي (HMM) Hidden Markov Model والذي مت تدريبو على خرج الفهرس من أجلكل عينات التدريب اليت حىت حصلنا على دقة 86%.

فهرس المحتويات العنوان مقدمة فهرس المحتويات تمهيد الباب األول : دراسة تعريفية ألنظمة التعرف على الكالم والصوت عند اإلنسان واألدوات المستخدمة في هذا البحث الرقم 2 5 7 7 8 8 9 11 14 17 17 18 19 20 21 23 23 24 27 28 30 31 الفصل األول : أساسيات سبييز الكال مقدمة : 1-1 مستويات سبييز الكال : 2-1 مصطلحات أساسية : 3-1 أنظمة سبييز الكال : 4-1 شرح سلتصر دلراحل التعرؼ على الكال : 5-1 صعوبات سبييز الكال الفصل الثاني : دراسة الصوت البشري : 1-2 تعريف الصوت : 2-2 اجلهاز الصويت وتكوين الصوت : 3-2 أعضاء جهاز الصوت عند اإلنساف : 4-2 مراحل الكال )إصدار الصوت ( : 5-2 أنواع سلارج الصوت الفصل الثالث : األدوات ادلستخدمة يف ىذا البحث : 1-3 رلموع االلتفاؼ Convolution Summation : 2-3 ربويل فورييو Fourier Transform : 3-3 التقطيع إىل إطارات والنوافذ : 1-3-3 أنواع النوافذ : 4-3 رلموعة ادلرشحات Filter Bank : 1-4-3 أنواع ادلرشحات حسب طوؿ النافذة 2

34 35 35 36 38 40 41 41 44 44 47 48 49 49 50 50 51 51 52 53 54 56 الباب الثاني : دراسة تفصيلية في مراحل التعرف على الكلمات المعزولة الفصل األول : التسجيل ومعاجلة اإلشارة مقدمة : 1-1 معاجلة اإلشارة Signal Processing : 1-1-1 التصحيح حسب ادلتوسط : 2-1-1 ربليل طيف اإلشارة : 3-1-1 ربس ت اإلشارة Pre-emphasis : 4-1-1 تطبيق مرشح التمرير ادلرتفع High pass filter : 2-1 ربديد بداية وهناية الكال Speech boundary detection : 1-2-1 ربليل الطاقة ذو الف تة الزمنية الصغ تة Short-term energy measure الفصل الثاني : استخراج السمات Features Extraction : 1-2 ربليل ادلركبات الطيفية Cepstral Analysis : 2-2 تقنية Coefficients(MFCC) Mel Frequency Cepstral الستخراج السمات : 3-2 مراحل عمل تقنية MFCC : 1-3-2 تقسيم اإلشارة إىل إطارات Frame Blocking : 2-3-2 تطبيق النافذة Windowing : 3-3-2 ربويل فورييو السريع Fast Fourier Transform(FFT) : 4-3-2 تطبيق ادلرشحات ال تددية Mel Frequency Warping 5-3-2: تطبيق اللوغاريتم على خرج ادلرشحات )حساب الطاقة اللوغاريتمي ) Computation Log Energy : 6-3-2 تطبيق التحويل اجلييب ادلتقطع Discrete Cosine Transform (DCT) : 7-3-2 مالحظات حوؿ السمات ادلميزة لإلشارة الفصل الثالث : التكميم الشعاعي وتوليد الفهرس & Quantization Vector Generating Codebook مقدمة : 1-3 التكميم الشعاعي (VQ) Vector Quantization : 1-1-3 خوارزمية K-Means 3

59 61 61 62 63 64 65 66 66 67 69 69 72 74 77 81 81 82 82 84 84 85 86 87 : 2-3 تطبيق التكميم الشعاعي على مسات الكال وتوليد الفهرس Code Book generating الفصل الرابع : ظلاذج ماركوؼ ادلخفية (HMM) Hidden Markov Model مقدمة : 1-4 سالسل ماركوؼ ادلالحظة وادلخفية : 1-1-4 عمليات ماركوؼ Markov processes : 2-1-4 ظلاذج ماركوؼ ادلخفية : 3-1-4 مثاؿ توضيحي : 2-4 رموز النموذج )عناصر )HMM : 3-4 توليد ادلالحظات من النموذج : 4-4 ادلسائل الثالث األساسية يف ظلوذج ماركوؼ ادلخفي : 1-4-4 شرح ادلسائل الثالث ؿHMM : 2-4-4 حلوؿ ادلسائل الثالث لنموذج ماركوؼ ادلخفي HMM : 1-2-4-4 حل ادلسألة األوىل : 2-2-4-4 حل ادلسألة الثانية : 3-2-4-4 حل ادلسألة الثالثة : 5-4 أنواع ظلاذج ماركوؼ Types of HMMs الباب الثالث : الدراسة العملية والنتائج خاتمة المراجع الفصل األول : دراسة تأث ت بارام تات معاجل اإلشارة على نتائج التدريب : 1-1 معامل ربس ت اإلشارة : 2-1 عتبة مرشح التمرير ادلرتفع : 3-1 عتبة الطاقة يف ربليل الطاقة قص ت احلد الفصل الثاني : دراسة تأث ت بارام تات استخراج السمات على نتائج التدريب : 1-2 طوؿ النافذة والتداخل : 2-2 عدد السمات 4

تمهيد من خالؿ اطالعنا على ما وصلت اليو التكنولوجيا يف أيامنا ىذه قررنا العمل على مشروع يعد من أىم اجملاالت يف الوقت احلاضر والذي ما زاؿ العمل عليو قائما لتطويره والوصوؿ اىل أفضل شكل شلكن لو ىذا اجملاؿ ىو التعرؼ على الكال احملكي أو سبييز الكال recognition) (Speech وبناء نظا للتعرؼ على الكلمات ادلنفصلة. يف عا 8968 طرح فيلم يف اخلياؿ العلمي وػلمل اسم) Odyssey A( Space وقد قد ىذا الفيلم فكرة التعرؼ اآليل على الكال عن طريق ادلركبة الفضائية اليت تستمع ألوامر قائدىا صوتيا وتنفذىا. فبدأ الباحث وف والعلماء منذ ذاؾ احل ت زلاولة زلاكاة ىذا اخلياؿ وربويلو إىل واقع ملموس. ومن مث قامتDARPA بعمل أحباث يف رلاؿ التعر ؼ اآليل على الكال وأنفقت ما يقارب 3 مالي ت دوالر سنويا دلدة 5 سنوات على ىذه األحباث ويعد ىذا ادلشروع أكرب مشروع يف رلاؿ التعر ؼ اآليل على الكال وكانت بداية ىذا ادلشروع يف عا 8978. يف عا 8984 أنشئت شركة SpeechWorks واليت تعترب من الشركات الرائدة يف رلاؿ التعرؼ اآليل على الكال وتطبيقاتو. ويف عا 8995 طرحت شركة Dragon أوؿ نظا إمالء صويت ولكن باللغة االصلليزية وتبعتها شركة IBM بشهور قليلة ولكن كانت ىذه الربامج تتعرؼ على الكال ادلتقطع حبيث ؽللي اإلنساف الكال للكمبيوتر كلمة كلمة وال ؽللي كالمو بشكل مستمر. ومن مث مت طرح برنامج لإلمالء الصويت ادلستمر بواسطة شركة Dragon باللغة اإلصلليزية يف عا 8997]7[. وتوالت بعدىا اجلهود يف اللغة اإلصلليزية وطرحت برامج عديدة يف رلاؿ التعرؼ اآليل على الكال ووصلت الربامج لدرجة رائعة من الدقة يف اللغة اإلصلليزية. يوجد للباحث األمريكي Lawrence Rabiner عدةكتب يف رلاؿ معاجلة اإلشارة واستخراج السمات ادلميزة منها وأيضا يف ظلاذج ماركوؼ ادلخفية وتطبيقها يف حقل سبييز الكال واليت عرضها بشكل مفصل ودقيق يف أحباثو يف شبانينات وتسعينات القرف ادلاضي. 5

الباب األول دراسة تعريفية لنظم التعرف على الكالم والصوت عند اإلنسان واألدوات المستخدمة في هذا البحث 6

الفصل االول أساسيات تمييز الكالم مقدمة : سبييز الكال أو التعرؼ على الكال ىو احلقل ادلهتم جبعل اآللة تستمع اىل كال اإلنساف وتفهمو وتعاجلو بالطريقة ادلطلوبة. ي عد تعر ؼ الكال إجرائية رب و ؿ اإلشارة الصوتية ادللتػ ق طة من ىاتف أو ميكرفوف إىل رلموعة كلمات قد تكوف ىذه الكلمات ىي النتيجة ادلرجوة النهائية وقد تتحوؿ كدخل إىل نظم معاجلة لغوية الحقة للحصوؿ على فهم الكال إلعطاء تفس ت ذلذا الكال والتصرؼ على أساسو. ودبا اف نظم سبييز الكال ربتك بشكل كب ت مع علو أخرى فقد يكوف من الصعب ربديد قواعدىا احلقيقية اليت من شاهنا اف تودي اىل نتائج مرضية لذلك سنكتفي دبا توصلت اليو البحوث يف رلايل معاجلة اإلشارة وعلم احلاسوب والقليل من علم اللغة. القائمة التالية سبثلكل العلو ادلرتبطة بالتعرؼ على الكال: معاجلة اإلشارة. االلك تونيات. علم احلاسوب. الرياضيات واإلحصاء. علم النفس. علم اللغة. - - - - - - 7

من الناحية اللغوية توجد مستويات عدة للتعرؼ على الكال عند الوصوؿ اىل ادلستوى النهائي نكوف قد وصلنا اىل غايتنا من التحقق الكامل لفهم الكال من الناحية النظرية. : مستويات تمييز الكالم : 1-1 إذا اعتربنا اإلشارة الصوتية نقطة البداية فانو يتوقف ربقيق فهم تا دلا قيل على توافر أنواع ادلعرفة التالية: :)phonetic( وىي خواص صبيع األصوات الواردة يف الكلمات. :)phonological( القواعد اليت ربكم اختالؼ نطق األصوات حسب السياؽ مثل التفخيم واالدغا والتنوين وغ تىا. :)morphemic( القواعد الصرفية مثل تصريف األفعاؿ. :)prosodic( القواعد اليت تصف االختالؼ يف النرب والتنغيم مثل النرب ادلرتفع هناية السؤاؿ. :)syntactic( القواعد اليت ربكم تكوين العبارات واجلمل. :)semantic( طرؽ استبعاد الكلمات او اجلمل اليت تكوف صحيحة ضلويا ولكن غ ت زلتملة الورود. :)pragmatic( القواعد اليت سبكن السامع من استنتاج نوايا ادلتكلم وذلك باف يكوف تفس ته للرسالة أكثر من رلرد التفس ت السطحي للرسالة اللغوية. - - - - - - - : مصطلحات أساسية : 2-1 : النطق) Utterance ( يف نظم سبييز الكال نع ت بالنطق الكلمة او الكلمات اليت سبثل كمع ت وحيد للحاسوب وؽلكن اف يكوفكلمة او عدةكلمات او صبلة او حىت عدة صبل. 8

: )speaker Dependendance( اعتمادية المتكلم بعض نظم سبييز الكال مصممة دلتكلم بعينو وىي أكثر دقة من األنظمة ادلصممة للتكيف مع عدة مستخدم ت تف تض األنظمة ادلعتمدة على ادلتكلم اف يتكلم بصورة ثابتة ومعدؿ إيقاؼ منتظم اما نظ تهتا فتستخد تقنيات التدريب. : )Vocabularies( المفردات ادلفردات او القاموس ىي قوائم الكلمات او النطق اليت سوؼ ؽليزىا النظا عموماكلما زاد حجم القاموس زادت صعوبة سبييز الكلمات. وعلى خالؼ القواميس الطبيعية ليس بالضرورة اف يكوف لكل مدخل كلمة مقابلة وحيدة فقد تكوف صبلة او اثنت ت. : ( Accurat( قياس الدقة قابلية التمييز ؽلكن اف تفحص بقياس دقتها ليس فقط سبييز النطق الصحيح ولكن معرفة ما اذا كاف ادلنطوؽ من القاموس او ال. أنظمة سبييز الكال ذلا القدرة على التكيف مع ادلستخد مىت ما وجدت ىذه القابلية يبدا ظهور التدريب. يكوف التدريب بامتالؾ تكرارات قياسية من ادلتكلم او بالعبارات الشائعة وتعدؿ خوارزميات ادلقارنة جملاراة متكلم مع ت. نستنتج شلا سبق اف نظم سبييز الكال ليس مسمى لنظا بعينو واظلا قاسم مش تؾ ب ت عدد من األنظمة قد زبتلفكث تا من ناحية التصميم والتطبيق وفيما يلي انواعها الشائعة. : أنظمة تمييز الكالم : 3-1 من وجهة نظر ادلصمم ت قسمت اىل فئات باعتبار نوع النطق الذي ػلدد قابلية التمييز ىذه الفئات تعتمد على أساس واحد وىو مىت يبدا ادلتكلم النطق ومىت ينتهي. وىذه الفئات ىي: 9

)isolated words( الكلمات المتفرقة.i أنظمة الكلمات ادلعزولة ىذه ىي العادة تتطلب اف يكوف كل نطق ىادئ نع ت هبذا قلة اإلشارة السمعية علىكال جانيب النافذة ادلعنية )النافذة ىي نتاج تقسيم اإلشارة اىلكلمات([ 5 ]. ىذا ال يع ت اف النظا يستقبل كلمات وحيدة لكن يتطلب النطق الوحيد يف الزمن ادلع ت ويف غالب األحياف ىذه األنظمة ذلا حاليت السمع وعدمو تطلب ىذه النظم من ادلتكلم االنتظار ب ت النطق والذي يليو يف ىذه الف تة ذبري عمليات ادلعاجلة. )connected words( الكلمات المتصلة.ii تشبو اىل حد كب ت الكلمات ادلتفرقة لكن تسمح بأكثر من نطق وغلب ترؾ فراغات بينها. )continuous speech( الكال ادلستمر.iii الفئة األكثر صعوبة الف على ادلصمم ت استخدا طرؽ خاصة يف ربديد حدود النطق. تقريبا غلعل ادلستخدم ت يتكلموف بطبيعتهم بينما يقو احلاسوب بتقرير لفظ الكال. )spontaneous speech ( الكالم التلقائي.iv بدوف تدريب يقو النظا بتمييز الكال الطبيعي نظم التمييز من ىذه الفئة غلب اف تكوف ذلا القدرة اف تلمس التنوع يف خصائص الكال الطبيعي. )Voice verification/identification( البصمة الصوتية.v بعض نظم سبييز الكال ذلا قدرة على اكتشاؼ االصوات دلن يستخدمها ىذا النظا يعترب نظاما امنيا. اما من وجهة نظر ادلستخد الذي يهتم بالتطبيق فاف كل مها احلاسوب ؽلكن فالتطبيقات التالية سبثل فئات تلك النظم ادلوجود حاليا : لنظا سبييز الكال أدائها - االمالء )Dictation( 01

األكثر شيوعا اليو يف بيئة االعماؿ حيث لتلك الفئة القدرة على معاجلة الكلمات ويف بعض احلاالت تزداد الدقة تلقائيا دبفردات خاصة. - األوامر والتحكم Control( )Command and ىي تلك األنظمة ادلصممة ألداء الوظائف واالعماؿ يف نظا يكوف سبييز الكال إضافة ثانوية مثل "افتح ادللف". - االرساؿ اذلاتفي) Telephony ( تسمح بعض أنظمة الربيد الصويت لألشخاص ادلتصل ت بإصدار األوامر بدؿ كبس االزرار. - تطبيقات أخرى العديد من التطبيقات لنظم سبييز الكال اليت نشهد بدايتها اليو مثل التعرؼ على الكال يف األجهزة احملمولة. 4-1 :شرح مختصر لمراحل التعرف على الكالم : حىت يتم التعرؼ على الكال يف اإلشارة الصوتية غلب أف سبر ىذه اإلشارة بعدة مراحل ادلراحل بشكل سلتصر : سنعرؼ ىذه تسجيل و معالجة اإلشارة processing) :(Recording & Signal يتم التقاط ادلوجات الصوتية الصادرة عن ادلتكلم من خالؿ ميكروفوف احلاسب على تردد تقطيع 11025. Hz سبر اإلشارة ادلسجلة دبجموعة من ادلرشحات بقصد التخلص من الضجيج أو بعبارة أخرى زيادة نسبة اإلشارة إىل الضجيج Rate) SNR (Signal to Noise لتصبح يف احلد ادلقبوؿ[ 3 ]..a 00

بعد ذلك سبرر اإلشارة على عدد من العمليات بقصد التخلص من ادلساحات الساكنة اليت توجد على أطراؼ اإلشارة وذلك لعدد من األسباب أعلها ربس ت نتائج التعرؼ على الكلمات حيث أف ىذه ادلساحات تؤثر بشكل ما على نتائج عملية التعرؼ. : استخراج سمات اإلشارة Extraction) (Features يف ىذه ادلرحلة يتم تطبيق تقنيات.b تساىم يف استخراج شليزات إشارة صوتية تساعد يف عملية سبييز زلتوى ىذه اإلشارة عن غ تىا حيث يتم استخدا ىذه السمات يف تدريب نظا احتمايل أو شبكة عصبية لتمييز زلتوى الكال توجد عدة طرؽ الستخراج السمات من اإلشارات سنعرؼ بعضها يف ىذا الفصل باختصار : : أو بالعربية :ال تميز التنبؤي اخلطي : LPC (Linear Predictive Coding) تعترب التقنية األكثر استخداما يف عملية ضغط الصوت وكذلك التعرؼ منذ على الكال ظهورىا يف ستينيات القرف ادلاضي حيث تقد طريقة واضحة ومقنعة يف ربليل الكال[ 3 ]. تقو فكرة LPC على اف تاض أف كل عينة من عينات الصوت ترتبط خطيا مع رلموعة من العينات اليت تسبقها أي يتم بناء ظلوذج متتابع لتقدير شكل ف تة قص تة من طيف إشارة الكال )إطار( باالعتماد على القيم القصوى دلركبات اإلشارة. : MFCC (Mel Frequency Cepstral Coefficients ) وىي ظلوذج السمات ادلستخد يف ىذا البحث حيث تعترب أكثر أنوع طرؽ استخراج السمات الصوتية استخداما وذلك بسبب نتائجها اجليدة والقدرة على التخلص اجلزئي من الضجيج يف مراحلها االوىل[ 2 ]. تعتمد ىذه الطريقة على التحليل الطيفي لإلشارة وذلك للحصوؿ على استجابة ادلسار الصويت لدفقات اذلواء الصادرة عن الرئت تكما ورد يف الفصل السابق تطبق أيضا على اإلشارة رلموعة مرشحات سبرير حزمة دلعرفة استجابة االشارة يف كل مرشح حيث أف ىذه ادلرشحات تسلك سلوكا خطيا يف تزايدىا من أجل ال تددات ادلنخفضة وتزايدا لوغاريتميا من أجل ال تددات ادلرتفعة وذلك دلقاربة استجابة األذف البشرية. التدريب (Training) : وغلري يف ىذه ادلرحلة بناء النموذج الرياضي للتعرؼ على ادلفردات وتقسم.c إىل قسم ت : 02

التكميم الشعاعي : (Vector Quantization) يف ىذه ادلرحلة يتم ربويل السمات ادلستخرجة يف مرحلة استخراج السمات إىل شكل ؽلكن استخدامو كدخل للنموذج االحتمايل باإلضافة إىل أنو غلري ذبميع السمات ادلتشاهبة وتعطى قيمة مش تكة تعرب عنها وتسمى ىذه العملية عنقدة (clustering) بناء النموذج االحتمالي وتدريبه :.[3][5] الكلمات ادلرادة )يف ىذا البحث استخدمنا األرقا االنكليزية ). وىي ادلرحلة األساسية يف النظا واليت غلري من خالذلا سبييز توجد عدة ظلاذج رياضية احتمالية من ادلمكن استخدامها للتعرؼ على الكال سنستخد يف ىذا البحث ظلوذجا احتماليا يسمى ظلوذج ماركوؼ ادلخفي (Hidden.[1][5] Markov Model (HMM)) إف ىذا النموذج يعتمد على شبكات ماركوؼ االحتمالية اليت تعتمد على قراءات من الوسط احمليط لتحديد النتيجة وىذه القراءات ىي خرج مرحلة التكميم الشعاعي السابقة. توجد عدة خوارزميات لتدريب ظلوذج ماركوؼ ادلخفي من أشهرىا : خوارزمية : forward-backward يف ىذه اخلوارزمية يتم تدريب كامل النموذج االحتمايل وكل الطرؽ ادلؤدية للنتيجة فيو أي بعبارة أخرى يتم حساب احتمالية كل الطرؽ ادلمكنة للوصوؿ إىل اجلواب. االختبار (Testing) : أي مرحلة استخدا النظا ويف ىذه ادلرحلة يتم تطبيق صبيع اخلطوات السابقة حىت مرحلة التكميم الشعاعي حيث تستخد نتائج مرحلة التدريب يف ربديد اخلرج ادلوافق للدخل يف ىذه ادلرحلة..d الشكل) 1-1 ( : يب ت مراحل نظا التعرؼ على الكال 03

: صعوبات تمييز الكالم [3]: 5-1 تنشا الصعوبة الكربى يف فهم الكال من وجود مصدرين للخطأ يرجع أحد ادلصدرين اىل ادلتكلم واالخر اىل السامع. وربدث الكث ت من األخطاء اثناء ترصبة ادلتكلم أفكاره اىل أصوات مثل اختيار الكلمات اخلطأ ونطقها خطا او بوضوح غ تكايف او تكراركلمات ح ت ال يكوف ضرورة لذلك وإصدار أصوات غريبة ال مع ت ذلا. وعلى السامع اف يقو بعكس العملية اليت قا هبا ادلتكلم فهو يبدا من الرسالة ادلشوىة اىل نوايا ادلتكلم ويرتكب أخطاء يف احلكم ألنو توجد قواعد دقيقة ربكم الفهم وفيما يلي بعض مؤثرات الرسالة الصوتية. سيكولوجيا ادلتكلم. الداللة والسياؽ. ال تاكيب. اعتبارات معجمية. جهاز النطق عند ادلتكلم. الضوضاء احمليطة. ادليكرفوف. - - - - - - - األصل. والنتيجة ىي اف ادلدخل لربنامج ربليل الكال ىو نسيج من العناصر الصوتية تعرب عن اجلملة ادلنطوقة يف وسيحتوي ىذا النسيج على أخطاء ال تقل نسبتها عن % 30 درجة كب تة من عد التحديد يف ادلعاجلة االلية. على أحسن الفروض وىو ما يؤدي اىل 04

ؽلكن استخالص من ىذا النسيج نسيج الكلمات حبساب صبيع التوافقات ادلمكنة ب ت األصوات يف ىذا السياؽ وىنا ؽلكن اف تنحصر مهمة برنامج التحليل يف اف غلد مسارا م تابطا منطقيا مستخدما صبيع ادلعلومات ادلمكنة. وقد ثبت اف ىذه العملية) من أسفل اىل اعلى ) ىي أعلى توافقية للغات اليت تزيد درجة تعقيدىا عن احلد األدىن وغلب اف تكمل بعملية معاجلة من اعلى ألسفل ترشدىا معلومات داللية وتركيبية ومعلومات أخرى. التالية: لتوضيح أكرب للمشكلة سنقو دبقارنة بسيطة بينها وب ت نظ تهتا اللغة ادلكتوبة فاللغة ادلكتوبة تتميز باخلصائص تفصل الكلمات بفراغات. يف الغالب تكوف صحيحة االمالء وكاملة. لدينا ادلقدرة على ذباىل او استخالص او إعادة القراءة لكلمة ما. اف كل من العوامل السابقة غ ت متوفرة يف اللغة ادلنطوقة فالكلمة قد تكرر او تفقد جزء منها او تشوه سباما نتيجة لألسباب التالية: احتواء الرسالة ادلنطوقة على ضجيج قد ال يكوف لو أي تفس ت منطقي. نطق الكال نادرا ما يكوف مضبوطا )اختالؼ نطق نفس العبارة من شخص اىل اخر(. اختالؼ نطق ادلتحدث الواحد لنفس العبارة )حسب احلالة النفسية والفسيولوجية(. تأثر الصوت الواحد يف حالة ينطق منفردا او معكلمات أخرى. ليست ىناؾ حدود واضحة يف اإلشارة الصوتية ب ت الكلمات ادلتتالية. بعض الكلمات قد تتفق يف النطق وزبتلف يف االمالء. - - - - - - 05

يقوؿ الدكتور فيليب جاكسوف اف سبب صعوبة سبييز الكال ناذبة عن جهلنا بأمور جذريةكث تة يف عملية الكال ب ت البشر والبحوث احلالية رباوؿ التحايل على ىذا اجلهل قدر اإلمكاف فتارة نستخد تقنيات مقارنة األظلاط وتارة أخرى الشبكات العصبونية ويرى اف الصعوبة تتفاوت حسب النظا وتقاس بالتايل: ىل النظا معتمد على متكلم واحد. ما ىو حجم الذخ تة اللغوية. ىل الكلمات منفردة ا متصلة. ما مدى تعقيد اللغة وما حجم ادلعرفة ادلتاحة حوذلا. درجة الغموض الصويت. التشويش. - - - - - - 06

الفصل الثاني دراسة الصوت البشري 1-2: تعريف الصوت: الصوت ىو تردد آيل أو السوائل والغازات وال من منظور علم األحياء موجة قادرة على التحرؾ يف عدة أوساط مادية مثل األجسام الصلبة تنتشر يف الفراغ وباستطاعة الكائن احلي ربسسو عن طريق عضو خاص يسمى فالصوت ىو إشارة ربتوي على نغمة األذن. أو عدة نغمات تصدر من الكائن احلي الذي ؽللك العضو الباعث للصوت تستعمل كوسيلة اتصاؿ بينو وب ت كائن آخر من جنسو أو من جنس آخر يعرب من خالذلا عما يريد قولو أو فعلو بوعي أو بغ ت وعي مسبق ويسمى االحساس الذي تسببو تلك الذبذبات بحاسة السمع. ويعد الصوت أساس الكث ت من اخلربات اليت يكتسبها االنساف. وقد كاف االنساف يف ادلاضي ال يعتمد على األصوات اليت يصدرىا من حنجرتو فحسب وإظلا أيضا على أصوات الطبوؿ واألدوات اليت ربدث اجللجلة واخلشخشة وأيضا بادلزام ت. وتقدر سرعة الصوت يف وسط ىوائي عادي ب 343 م ت يف الثانية أو 1224 كيلوم ت يف الساعة. تتعلق سرعة الصوت بعامل الصالبة وكثافة ادلادة اليت يتحرؾ فيها الصوت. 07

2-2: الجهاز الصوتي وتكوين الصوت: ىناؾ ثالثة أجزاء رئيسية يف جسم اإلنساف تقو بلعب األدوار ادلطلوبة إلنتاج الصوت وىي )الرئت ت( و)احلنجرة واحلباؿ الصوتية( و)األنف والفم(. تبدأ ىذه العملية من الرئت ت ومنهما ؼلرج اذلواء منطلقا إىل احلنجرة حيث ؽل ر باألحباؿ الصوتية اليت ىي ادلرحلة الثانية يف عملية إنتاج الصوت وىي أىم األجزاء الثالثة. واألحباؿ الصوتية ىي عبارة عن زوج ت من األغشية ادلخاطية ادلمتد بشكل عرضي يف اجلزء األوسط من احلنجرة 2( )الشكل يف ؽلكنك رؤية كيف تظهر األحباؿ الصوتية للناظر إىل داخل احلنجرة من األعلى تكوف احلباؿ الصوتية يف وضعها الطبيعي مفتوحة و تق تب من ببعضها يف حاؿ التحدث على حسب الصوت ادلراد إصداره)الشكل 3(. الشكل) 3-2 ( احلباؿ الصوتية يف وضع السكوت والتحدث الشكل) 2-2 ( احلباؿ الصوتية للناظر من األعلى الشكل) 8-2 (موقع احلباؿ الصوتية من احلنجرة 08

: أعضاء جهاز النطق عند اإلنسان: 3-2 درس علم األصوات احلديث جهاز النطق دراسة دقيقة مفصلة وقد أفاد علماء األصوات من علم وظائف األعضاء وعلم التشريح وفيزياء الصوت وساعدهتم األجهزة احلديثة من آالت تصوير وتسجيل وغ تىا من ربديد أعضاء ربتك هبا تلك األصوات. النطق واألصوات اليت تصدر عن طريق ىذه األعضاء والنقاط اليت ربصر عندىا أو و يقصد باجلهاز النطقي لدى احملدث ت من علماء اللغة رلموع أعضاء النطق ادلستقرة يف الصدر والعنق والرأس ويسميو بعض اللغوي ت "باجلهاز الصويت." وقد حدد علماء اللغة ادلعاصرين عدد األعضاء ادلكونة جلهاز النطق يف حوايل اث ت عشرة عضوا بعضها ذباويف وىذه األعضاء [6] ىي : : A. الرئتين: علا عضواف نسيجهما إسفنجي يزداد حجمهما وينقبض بسهولة ويسر كاإلسفنجة ومركزعلا التجويف الصدري ويقع القلب بينهما. B. القصبة الهوائية : مسيت قدؽلا بقصبة الرئة وىي أنبوبة سبتد من العنق إىل الصدر وللقصبة اذلوائية دور مهم يف عملية التنفس ففيها يتخذ النفس رلراه قبل اندفاعو إىل احلنجرة كما أهنا تعترب عامال ضروريا حلدوث الصوت. C. الحنجرة ىي جزء من رلرى التنفس تقع يف مقد العنق وتتصل باحللقو من أعلى وبالقصبة اذلوائية من أسفل كما أهنا تعترب األداة األساس للصوت اإلنساين إذ تضم الوترين الصوتي ت اللذين يتذبذباف مع معظم األصوات وي تتب عن معرفة تلك اذلزات احلكم على. درجة الصوت D.الوتران الصوتيان: عبارة عن أحرمة حلمية مغطاة بغشاء مطاطي لزج وعلا أشبو بشفت ت منهما بوترين ولكن جرى االصطالح على ىذه التسمية. وىذاف الوتراف متصالف باحلنجرة أفقيا من األما إىل اخللف وعلا من أعضاء النطق ادلتحركة وذلما القدرة على ازباذ أوضاع تؤثر يف األصوات الكالمية. سلتلفة 09

.F E. الحلق : ىو ذلك اجلزء ادلوجود ب ت احلنجرة وأقصى احلنك وىو من التجاويف اليت تقو للصوت مقا فراغ رن ت يضيق بارتفاع احلنجرة ويتسع باستقرارىا يف مكاهنا. اللهاة ادلتحركة : عضو حلمي يتدىل من أقصى سقف الفم ويشرؼ على اللساف وىو من األعضاء G.الحنك : وىو سقف الفم واجلزء األمامي منو وىو صلب لفصل الفم عن األنف وينقسم إىل : مقد احلنك أو اللثة ووسط احلنك أو احلنك الصلب وأقصى احلنك أو احلنك الل ت. H.اللثة : من أعضاء النطق ادلتحركة وىي جزء حلمي زلدب يقع خلف األسناف العليا وأما.I احلنك الصلب وىناؾ من يعدىا جزءا من احلنك. اللسان : وىو عضو حلمي لو دور مهم يف عملية النطق إذ يضم عددا كب تا من العضالت.J اليت سبكنو من االمتداد والتحرؾ واالنكماش والتلوي إىل األعلى أو إىل اخللف وينتج عن ربركاتو ادلختلفة عدد كب ت من اإلمكانات الصوتية يف اجلهاز النطقي. التجويف األنفي : يقع خلف غشاء احلنك متوسط طولو حوايل ست سم ويتكوف من.K ذباويف عديدة تغطى بغشاء سلاطي وىو من األعضاء الثابتة. : األسنان.L عبارة عن سلسلة عاجية مثبتة بالفك ت السفلي والعلوي من الفم وال تستغل األسناف يف النطق إال دبساعدة أحد األعضاء ادلتحركة كاللساف والشفة العليا. : الشفتان من أعضاء النطق ادلتحركة تتخذاف أوضاعا سلتلفة عند نطق األصوات ومن ادلمكن مالحظة ىذه األوضاع بسهولة ويسر إذ ؽلكن أف تنطبق الشفتاف فال تسمحاف للهواء باخلروج مدة من الزمن مث تنفرجاف فيندفع اذلواء زلدثا صوتا انفجاريا. : مراحل الكالم )إصدار الصوت ) : 4-2 إف الكلمة ادلنطوقة سبر بأربعة مراحل يف اجلهاز الصويت وب ت أف زبرج يف شكلها ادلفهو للسامع والبد من وجود احلافز عند ادلتكلم إلخراج الكلمة وقد يكوف احلافز نتيجة إصدار أمر فعل ما لرد فعل لذلك األمر من قبل ادلأمور بو أو لغرض فكرة ما على شخص أو أشخاص أو لفرضها من قبلو ويسلسل احلافز حىت يفهمكما يف ادلراحل اآلتية: 21

مرحلة التحريك: وفيها يتم اىتزاز احلبل ت الصوت ت بواسطة الزف ت اخلارج من صدر اإلنساف بسرعة ما فيتمثل بصوت )وبطبقة نغمية زلددة( يتجسد من خالؿ مد أحد احلروؼ الصوتية أو ؽلد مقطع ؽلثلو مد حرؼ صامت ما. مرحلة التصويت: تتم مرحلة التصويت عند استمرارية اىتزاز احلبل ت الصوت ت أو الوترين الصوت ت ادلوجودين داخل احلنجرة فيحدثاف زبلخال يف ىواء الزف ت ادلار يف رلرى ضيق أو ب ت عضوين أو أكثر من األعضاء اليت تكوف احلروؼ داخل الفم فيحدث آنذاؾ التصويت. مرحلة التقوية: ػلتاج يف مرحلة التصويت السابقة إىل تقوية وتضخيم ليصل إىل أوسع مدى شلكن وربدث التقوية يف ادلرحلة الثالثة بزيادة كمية الصوت ومقدار دفعو إىل اخلارج وتتم التقوية داخل التجاويف األنفية والفمية والبلعومية واليت تتحقق من خالؿ التمرينات ادلنتظمة ومثل ىذه التجاويف ادلختلفة يف الفم واألنف والبلعو سبثل الصندوؽ الصوتية أو الوترية. إف التشكيل: مرحلة الصويت بالنسبة للصوت البشري مقارنة بصوت اآللة اجلهد الذي يؤدي إىل ربريك احلبل ت الصوت ت بواسطة الزف ت مث التصويت من خالؿ التخلخل الذي ػلدث يف اذلواء مث تقويتو كما وصفت يتطلب تشكيل الصوت وتركيبو من خالؿ إعطائو أشكاال سلتلفة مث تركب تلك األشكاؿ لتكوف رموزا صوتية أو نغمية عرب حروفها لتعرب بالتايل عن معاين يقصدىا ادلتكلم ويفهمها السامع هبذه اللغة أو تلك. ويقو اللساف واألسناف والشفتاف واألعضاء األخرى ذات العالقة دبهمة التشكيل والتكوين دبا نسميو باحلروؼ أو )phonemes اللغوية. )ادلقاطع اليت ذبتمع لتكوف الكلمة ويف الغالب تتكوف الكلمة من مقطع ت أو أكثر من ادلقاطع.a.b.c.d : 5-2 أنواع المخارج الصوتية : تقسم سلارج احلروؼ اىل عدة [6] أنواع: المخرج الصوتي) voiced (: مصدر مزماري دوري يصدر من احلنجرة ومن أمثلتو احلرؼ a )مثال يفكلمة.)father المخرج الالصوتي االحتكاكي: مصدر أنفي ينتج من احتكاؾ اذلواء ادلتحرؾ مع انسداد ادلسلك الشفوي ومن األمثلة على ذلك: fall ).( th in thin, f in.i.ii 20

المخرج الالصوتي االنفجاري: مصدر مندفع يتم توليد االنفجار من خالؿ اإلفراج عن تراكم الضغط يف االنقباض الكلي لتجويف الفم من األمثلة على ذلك: pen p ) in., t in tea ) المخرج الالصوتي المهموس)الهمس(: ينتج من إقفاؿ جزئي للحباؿ الصوتية من دوف اىتزاز مثاؿ على ذلك: hat ) h ) in المخرج الصوتي االحتكاكي: ينتج من اىتزاز احلباؿ الصوتية وؼلرج عن الطريق األنفي مثاؿ على ذلك: zebra ) z ). in المخرج الصوتي االنفجاري: ينتج من اىتزاز احلباؿ الصوتية ويول د بضغط اذلواء ادلندفع مثاؿ على ذلك:( in did.( b in boat, d.iii.iv.v.vi ؽلثل الشكل التايل ادلخارج ادلوافقة للصوتيات يف اللغة اإلنكليزية : الشكل) 4-2 (: الصوتيات يف اللغة االنكليزية [6]. 22

الفصل الثالث األدوات والتقنيات الرئيسية المستخدمة في هذا البحث : : مجموع االلتفاف Convolution Summation 1-3 ىو عملية رياضية ب ت تابع ت لتشكيل تابع ثالث يعتمد على قيمتيهما حيث ػلسب رلموع االلتفاؼ حبساب رلموع جداءاتكل قيمة من أحد التابع ت مع قيمة مزاحة من التابع اآلخركما تب ت ادلعادلة التالية : ادلعادلة) 1-3 (: ( )( ) ( ) ( ) حيث أف الرمز يدؿ على رلموع االلتفاؼ. إف رلموع االلتفاؼ ليس لو أي مع ت فيزيائي مباشر إظلا يستخد يف حساب ناتج ربط تابع ت رياضي ت مع بعضهما البعض حيث أف ىذا اجملموع يستخد يف رلاالت متعددة : االحتماالت معاجلة اإلشارات... يف معاجلة اإلشارة نستخد رلموع االلتفاؼ حلساب اإلشارة الناذبة عن استجابة وسط ما للطاقة ادلقدمة ذلذا الوسط كما يستخد يف عملية تقطيع اإلشارة إىل إطاراتكما سنرى الحقا. مالحظة : في الدراسة النظرية يسمى هذا المجموع بتكامل االلتفاف ولكن في األنظمة الرقمية يحول هذا التكامل إلى مجموع. 23

: : تحويل فورييه Fourier Transform 2-3 إف ربويل فورييو يقد اسلوبا حلساب ال تددات ادلكونة إلشارة معينة حيث أنو مت إثبات أف أي إشارة تابع رياضي ؽلكن أف يكتب كمجموع توابع جيبيو وكل من ىذه التوابع لو تكرار مع ت يسمى ال تدد. أو إف ربويل فورييو يقيس التشابو ب ت اإلشارة أو التابع قيد الدراسة وب ت رلموعة التوابع اجليبية ذات ال تددات ادلختلفة كما توضح ادلعادلة التالية : ادلعادلة) 2-3 ( : ( ) ( ) حيث: ) ( ىو ربويل فورييو لإلشارة. ) ( عينات اإلشارة يف اللحظات. : تردد اإلشارة الذي نرغب حبساب توافقها مع ىذه اإلشارة. نالحظ من ادلعادلة السابقة أف ناتج ربويل فورييو ىو عبارة عن أعداد عقدية سبثل نسبة التوافق ب ت ىذه اإلشارة والتابع اجلييب ادلوافق لل تدد n حيث ؽلثل مطاؿ ىذه األعداد العقدية مقدار التوافق ب ت اإلشارت ت وتسمى ىذه ادلطاالت طيف اإلشارة ال تددي. نالحظ أننا نقلنا اإلشارة من رلاؿ الزمن إىل رلاؿ ال تدد حيث أف رلاؿ الزمن ىو تغ ت اإلشارة بتقد الزمن وكل حلظة زمنية سبثل مطاؿ مع ت أما رلاؿ ال تدد فهو تغ ت استجابة اإلشارة بزيادة ال تدد حيث يف اإلشارات ذات ال تدد ادلنخفض تكوف القيم ادلرتفعة لل تددات منخفضة ادلطاالت يف طيف اإلشارة والعكس بالعكس. 24

إف أىم فوائد ربويل فورييو أنو يساعد يف معرفة ترددات اإلشارة حيث أنو تكوف قيم مطاالت الطيف ال تددي كب تة عند ال تددات األكثر فعالية يف ىذه اإلشارة وضعيفة عند باقي ال تددات وبالتايل ؽلكن ربديد تردد اإلشارة وال تددات الغ ت مرغوبة واليت تعترب ضجيج على اإلشارة. الشكل) 1-3 ( : ؽلثل ىذا الشكل إشارة معينة و الطيف ال تددي اخلاص هبا إف ربويل فورييو متناظر أي أف القيم بعد منتصف الطيف سباثل القيم قبل منتصف الطيف كما يب ت الشكل لذلك يتم االحتفاظ فقط بالنصف األوؿ من التحويل. نالحظ من الشكل السابق أف أغلب االستجابات ربدث يف رلاؿ ال تددات ادلنخفضة أي أف تردد اإلشارة واكرب استجابة ىي ب تدد 250 Hz تقريبا لذلك صلد أف لتحويل فورييو فائدة يف ربديد ال تددات ذات األثر األكرب يف اإلشارة. يف ربويل فورييو إف طيف اإلشارة ىو عبارة عن جداء طيف اإلشارة الصادرة عن ادلنبع مع طيف استجابة الوسط أي نستطيع القوؿ أنو بتحويل اإلشارة إىل رلاؿ ال تدد ضلوؿ رلموع االلتفاؼ إىل جداء أطياؼ اإلشارات ادلشكلة ذلذه اإلشارةكما تب ت ادلعادلت ت التاليت ت : ادلعادلة) 3-3 (: ( ) ( ) ( ) 25

تشكيل اإلشارة يف رلاؿ الزمن حيث ىي استجابة الوسط ىي اإلشارة الصادرة عن ادلنبع. ادلعادلة )4-3( : ( ) ( ) ( ) حيث ىو طيف اإلشارة ادلقابلة الستجابة الوسط طيف اإلشارة الصادرة من ادلنبع. على الرغم من قدرة ربويل فورييو على ربديد ال تددات ادلكونة لإلشارة إال أف ىناؾ عيب ت رئيسي ت يف ىذا التحويل [6]: : العيب األول إف ربويل فورييو ػلدد ترددات اإلشارة ولكن ال ػلدد يف أي اللحظات الزمنية حصلنا على ىذا ال تدد حيث أف ربديد اللحظات الزمنية لو أعلية كب تة يف معرفة تغ ت تردد اإلشارة مع الزمن. حيث كما نالحظ من الشكل )1-3( أف اإلشارة ربوي رلموعة سلتلفة من ال تددات ولكن مل يتم ربديد الف تات الزمنية ادلوافقة ذلذه ال تددات. العيب الثاني : لنفرض لدينا اإلشارات اجليبية التالية ب تددات 20 60, Hz التالية ادلوضحة باألشكاؿ : ؽلثل ىذا الشكل تتايل إشارت ت جيبيت ت ب تددين سلتلف ت ؽلثل ىذا الشكل رلموع اإلشارت ت اجليبيت ت بنفس ال تددين 26

إف ىذا الشكل ؽلثل ربويل فورييو لكل من اإلشارت ت ادلوضحت ت بالشكل ت السابق ت ادلخطط )1-3(: ؽلثل إشارات رلموع وتتايل إشارات جيبية والطيف ال تددي لكل منها نالحظ من األشكاؿ السابقة أنو ؽلكن إلشارات سلتلفة يف رلاؿ الزمن أف يكوف ذلا نفس الطيف ال تددي لذلك ال ؽلكن معرفة اإلشارة من خالؿ طيفها ال تددي. : : التقطيع إلى إطارات و النوافذ Framing and Windowing 3-3 تقطيع اإلشارة ىو عملية تقسيم اإلشارة إىل عدد من األقسا يسمى كل منها إطار ويعاجل كل إطار بشكل مستقل عن بقية اإلطارات. يف أغلب األحياف ال نستطيع التعامل مع اإلشارة دفعة واحدة ألف ذلك قد يسبب نتائج غ ت مرضية حيث كما وجدنا يف الفقرة السابقة أف ربويل فورييو ال ػلدد اللحظات الزمنية ادلوافقة ل تدد مع ت لذلك كاف التقطيع ىو احلل االفضل حلساب ال تددات بشكل شبو زللي أي نكو ف معرفة جزئية عن اللحظات الزمنية ادلوافقة لل تددات. أما تطبيق النوافذ أو النوفذة Windowing يف عملية حساب تشابو ب ت تابع ت رياضي ت حيث يكوف األوؿ ىو اإلشارة أو اإلطار ادلدخل والثاين ىو التابع الرياضي ادلعرب عن النافذة أي أف تطبيق النافذة ىو رلموع التفاؼ ب ت اإلشارة والنافذة ويعرب عنها بالعالقة : ادلعادلة )5-3( : ( ) ( ) ( ) 27

: 1-3-3 أنواع النوافذ :[3] توجد أنواع عديدة جدا من النوافذ وكل ىذه النوافذ )عدا ادلستطيلة ) سبيل ألف تكوف منخفضة ادلطاالت عند طريف النافذة ومرتفعة يف منتصفها وذلك إللغاء تأث ت عينات اإلشارة من الطرف ت وحصر تطبيق النافذة دبجموعة من العينات يف وسط النافذة. سنستخد يف حبثنا ىذا ثالث أنواع من النوافذ : النافذة المستطيلة : Rectangular Window وتعترب أبسط النوافذ ويعرب عنها بادلعادلة التالية : ادلعادلة) 6-3 ( : o ( ) { ح ثي ىو طوؿ النافذة. إف تطبيق ىذه النافذة على إشارة معينة يكافئ تقطيع ىذه اإلشارة إىل إطارات كل منها بطوؿ وىذه النافذة سبثل بالشكل : الشكل) 2-3 (: ؽلثل النافذة ادلستطيلة 28

نافذة هامينغ : Hamming Window ىي أشهر أنواع النوافذ وذلا استخدامات كث تة يف رلاؿ معاجلة اإلشارة كما سنرى يف ىذا البحث حيث أف ىذه النافذة تعطى بادلعادلة : ادلعادلة )7-3(: o ( ) ( ) حيث طوؿ النافذة وشكل ىذه النافذة : الشكل )3-3(: ؽلثل نافذة ىامينغ النافذة المثلثية : تعترب ىذه النافذة ىي رلموع Triangular Window o التفاؼ ب ت نافذت ت مستطيل ت ويعرب عنها بادلعادلة : ادلعادلة )8-3(: ( ) حيث طوؿ النافذة وشكل ىذه النافذة : الشكل )4-3( : ؽلثل النافذة ادلثلثية 29

: : المرشحات Filter Bank 4-3 ىي عملية تطبيق رلموعة من ادلرشحات ال تددية على اإلشارة هبدؼ حساب استجابة اإلشارة لكل من ىذه ادلرشحات وتعترب ىذه العملية من أىم العمليات يف معاجلة اإلشارات حيث أهنا تساعد يف ربديد مركبات اإلشارة وربليل وبناء اإلشارات. تعترب ىذه النظم ذات تقييمات متعددة multirate systems وذلك لتنوع النتائج اليت تظهر من تطبيق رلموعة من ال تددات على اإلشارة واليت تؤدي إىل نتائج سلتلفة لنفس اإلشارة. يعرب عن تطبيق ادلرشحات بالشكل التايل : الشكل) 5-3 ( :ؽلثل تطبيق ادلرشحات على اإلشارة [3] إف ادلرشحات ال تددية ما ىي إال عملية تطبيق لنوافذ على اإلشارة حلساب التشابو ب ت ىذه النافذة واإلشارة ولكن الفرؽ ب ت تطبيق النوافذ وتطبيق ادلرشحات ىو أنو بتطبيق النوافذ سبرر على عينات اإلشارة نافذة واحدة أما يف ادلرشحات يطبق على اإلشارة رلموعة من النوافذ لكل منها قيم سلتلفة عن قيم األخرى وىذا ما غلعل النوفذة ( تطبيق النوافذ ) ال ػلدد االستجابات ال تددية لإلشارة حيث يعرب عن تطبيق ادلرشحات دبجموع االلتفاؼ التايل : ادلعادلة )9-3(: ( ) ( ) ( ) ( ) ( ) ترتيب ادلرشح استجابة ادلرشح طوؿ نافذة ادلرشح اإلشارة ادلرشحة. حيث : 31 إف ادلرشحات يف حبثنا ىي مرشحات سبرير حزمة أي أف كل مرشح خاص دبجموعة معينة من ال تددات ويتم حساب طيف اإلشارة يف ىذا ادلرشح تبعا ل تدداتو.

: أنواع المرشحات حسب طول النافذة [3]: 1-4-3 إف لكل مرشح تردد مركزي متساو البعد عن ال تددين األعظمي واألصغري ذلذا ادلرشح حيث أف ادلسافة ب ت ال تددات ادلركزية للمرشحات ربدد أطواؿ نوافذ ادلرشحات وبالتايل نوع ادلرشحات حيث تقسم إىل قسم ت رئيسي ت : المرشحات المنتظمة : Uniform Filter Bank يعترب ىذا النوع ىو النوع األقد من ادلرشحات حيث تكوف النوافذ متساوية الطوؿ ويكوف ال تدد ادلركزي لكل مرشح ػلسب بالعالقة : ادلعادلة )10-3( : o حيث ىو عدد ادلرشحات عدد ادلرشحات الالزمة لتغطية كامل اجملاؿ ال تددي تردد تقطيع اإلشارة. بشكل عا إف وعرض رلاؿ ادلرشح ىو الشكل )6-4( : ؽلثل ادلرشحات ادلنتظمة. المرشحات غير المنتظمة : Non Uniform Filter Bank يف ىذا النوع من ادلرشحات يكوف عرض كل مرشح سلتلف عن باقي ادلرشحات وىذا األمر يسمح بال تكيز على استجابة مرشح دوف اآلخر ويعترب ىذا النوع مفيدا جدا يف o 30

أنظمة التعرؼ على الكال حيث ؽلكن بناء مرشحات رباكي استجابة األذف ل تددات الكال. ؽلكن التعب ت عن عرض ىذه ادلرشحات بأي عالقة رياضية متغ تة القيم حيث يف ادلعادلة التالية يزداد عرض حزمة ادلرشح بشكل خطي : ادلعادلة) 11-3 ( : حيث C ثابت وىو عرض حزمة ادلرشح األوؿ مقدار الزيادة. وال تدد ادلركزي ذلذه ادلرشحات يعطى بالعالقة : ادلعادلة )12-3( : بفرض C=200 i= ضلصل على الشكل التايل : الشكل) 7-3 ( : ادلرشحات غ ت ادلنتظمة ادلتزايدة بشكل خطي 32

الباب الثاني دراسة تفصيلية لمراحل نظام التعرف على الكلمات المعزولة 33

الفصل األول تسجيل ومعالجة اإلشارة Recording & Signal processing مقدمة: إف ىذه ادلرحلة ىي األوىل يف أي نظا صويت سواء كاف نظا تعرؼ على الكال أو نظا لضغط الصوت او أي نظا آخر حيث يتم يف ىذه ادلرحلة تطبيق رلموعة من التقنيات الرياضية على اإلشارات لتحس ت جودهتا والتخفيف من أخطاء التسجيل واليت تنشأ لعدة عوامل مؤثرة من البيئة احمليطة. يف البداية نقو بتسجيل اإلشارة الصوتية واليت ستمثل عينات التدريب أو عينات االختبار حيث أنو يتم تسجيل ىذه اإلشارة على تردد 11025 Hz حيث قمنا بتسجيل عينات التدريبكما يلي : دبا أف نظامنا ىو نظا تعرؼ على األرقا االنكليزية قمنا بتسجيل أصوات 20 شخص )11 ذكور و 9 إناث ) على تردد 11025 Hz ومن أجلكل شخص قمنا بتسجيل نطقو لكل رقم من األرقا عشر مرات أي أف كل شخص مت تسجيل 150 عينة صوتية لو ومنو يكوف حجم البيانات الكلي الذي قمنا بتسجيلو ىو : عينة =2000 10 * 10 * 20 إف ىذه العينات سبثل عينات التدريب واالختبار ومن مث ذبري معاجلة ىذه العينات وذلك من أجل رفع نسبة اإلشارة إىل الضجيج (SNR)( )Signal to Noise Ratio حيثكلما زادت ىذه النسبة كلماكانت اإلشارة أفضل وأنقى من الضجيج وتعترب النسبة ادلثالية ىي.[5] 30 dbs بعد أف تتم معاجلة اإلشارة ضلتاج للتخلص من ادلساحات الساكنة يف اإلشارة وربديد بداية وهناية النطق حيث أف التسجيل ػلوي حلظات صمت قبل وبعد النطق وىذه ادلساحات الصامتة تسبب خطأ يف قيم السمات ادلستخرجة من ىذه اإلشارة عند تطبيق تقنية استخالص السمات على اإلشارة لذلك وجب التخلص منها. 34

: : معالجة اإلشارة Signal Processing 1-1 تشمل معاجلة اإلشارة كل العمليات الرياضية اليت تطبق على إشارة معينة هبدؼ زبفيض الضجيج فيها وزيادة فائدهتا يف سبييز البيانات اليت ربملها. من ب ت كل العمليات ادلمكنة سنطبق ما يلي : التصحيح حسب ادلتوسط Mean Correction ربليل طيف اإلشارة Spectrogram analysis تطبيق مرشح سبرير مرتفع High pass filter ربس ت اإلشارة Pre-emphasis حيث أف كل عملية من ىذه العمليات تساىم يف ربس ت شكل اإلشارة وترفع من كفاءهتا. 1-1-1 التصحيح حسب المتوسط : Mean correction إف أوىل العمليات اليت ؽلكن تطبيقها ىي تعديل قيم اإلشارة تبعا للمتوسط حيث أف الغرض من ىذه العملية ىو زبفيض أثر أي مركبة مستمرة [5] تنتجها أجهزة التسجيل طلتار عتبة معينة من ادلتوسط ونطرحها من قيم اإلشارة حيث أف قيمة ىذه العتبة صع ته جدا وال تتجاوز 0.05 إف ىذه العملية ال تغ ت يف شكل اإلشارة إظلا تعدؿ ادلطاالت بشكل طفيفكما يف الشكل التايل : الشكل) 1-1 ( : يعرب عن تطبيق تصحيح لإلشارة ادلمثلة لنطق الرقم one بعتبة 0.026 35

كما يب ت الشكل )1-1( ال يوجد فرؽ واضح ب ت اإلشارت ت حيث أنو وكما وضحنا سابقا اذلدؼ األساسي من ىذه العملية ىو زلاولة التخفيف من أثر ادلركبات ادلستمرة اليت ؽلكن أف تنتجها أجهزة التسجيل. : 2-1-1 تحليل طيف اإلشارة : Spectrum analysis تكمن أعلية ربليل طيف اإلشارة يف نقطت ت : األولى : ىي أف اإلشارة يف رلاؿ الزمن ال تعطي صورة واضحة عن ادلركبات ادلهمة يف اإلشارة والثانية : أنو يتيح لنا التعرؼ على ماىية ال تددات ادلكونة ذلذه اإلشارة وحذؼ كل ال تددات اليت قد تكوف ذات أثر سليب على ىذه اإلشارة حيث وذلك ألف تردد إشارة الكال عند اإلنساف يقع يف اجملاؿ ب ت 300 و Hz 3700 Hz فأي تردد خارج حدود ىات ت العتبت ت ؽلكننا اعتباره ضجيج على ىذه اإلشارة شلا يسمح ب تشيح ىذه اإلشارة للتخلص منو. إف ربليل طيف اإلشارة ىو تطبيق لتحويل فورييو Fourier Transform على قطاعات جزئية من اإلشارة تسمى إطارات حيث يعترب كل إطار إشارة مستقلة ويطبق عليو ربويل فورييو بشكل مستقل عن بقية اإلطارات واذلدؼ من ىذا األسلوب ىو معرفة ال تددات ادلوجودة يف كل إطار زم ت )حساب ال تدد زلليا يف اإلطار وليس يف كل اإلشارة ) وتسمى ىذه العملية بتحويل فورييو قص ت احلد Short-Time Fourier (STFT) Transform ويكوف ناتج STFT ىو رسم ثنائي البعد ؽلثل اإلطارات الزمنية وال تددات ادلقابلة لكل إطار. ؽلثل ادلخطط التايل التحليل الطيفي لإلشارات ادلمثلة لكل مفردات النظا اليت لدينا )األرقا اإلنكليزية ) : 36

ادلخطط )1-1( : ؽلثل رلموعة من رسو الطيف ال تددي لإلشارات ادلمثلة لتسجيل شخص واحد جملموعة مفردات النظا اليت سيتم التعرؼ عليها وىي األرقا االنكليزية حيث نالحظ من األشكاؿ أف أغلب ىذه الطيوؼ تش تؾ ب تددات صغ ته ربت. 100 Hz 37

يف األشكاؿ السابقة نالحظ أنو ومن أجل كل إطار يف كل إشارة )مت التقسيم باستخدا تابع 1000 وHz 100 Hz يف ماتالب ) أف أكثر ترددات اإلشارة ىي ترددات منخفضة ب ت spectrogram و وجود بعض ال تددات ربت عتبة 100 حيث Hz أف الصوت البشري أعلى من ىذه العتبة وبالتايل فإف ىذه ال تددات سبثل إشارة غ ت مرغوبة غلب التخلص منها[ 5][3 ]. مالحظة : درجة اللون األحمر في طيف اإلشارة تحدد مقدار استجابة اإلشارة لهذا التردد أي انه كلما زادت درجة اللونكان مطال الطيف عند هذا التردد أعلى والعكس بالنسبة للون األزرق. نالحظ يف بعض اإلشارات وجود إطارات تكوف فيها االستجابة لل تددات ضعيفة فنستنتج من ذلك أف ىذه اإلطارات ىي مساحات فرعة غلب قطع اإلشارة عندىاكي ال تؤثر على عملية استخراج السمات. : 3-1-1 تحسين اإلشارة : Pre-emphasis يف ربليل طيف اإلشارة الحظنا وجود ترددات غ ت مرغوبة تنتج من البيئة احمليطة أثناء عملية التسجيل ىذه ال تددات ىي ترددات منخفضة ال تعترب من ترددات الكال ادلنطوؽ من قبل الشخص لذلك غلب حذفها من اإلشارة. إف اإلشارة ادلمثلة للكال تكوف فيها ال تددات ادلرتفعة ذات مطاالت منخفضة)مثل األحرؼ الالصوتية كاألحرؼ االنفجارية مثل ) t والعكس بالعكس )أي الصوتيات phonemes( ) ) ذات ال تدد ادلنخفض تكوف دبطاالت مرتفعة [3] وأيضا األحرؼ الصوتية تكوف دبطاالت مرتفعة واذلدؼ من عملية ربس ت اإلشارة ىو رفع مطاالت ال تددات ادلرتفعة مقابل مطاالت ال تددات ادلنخفضة حبيث نزيد من القدرة على التنبؤ بالصوتيات اليت سبثلها ىذه ال تددات. الشكل) 2-1 (: ؽلثل ىذا الشكل اإلشارة الصوتية ادلمثلة لنطق الرقم two 38

نالحظ من الشكل أف مطاؿ احلرؼ t )وىو حرؼ تردده مرتفع ألنو حرؼ انفجاري النطق ) منخفض بعكس مطاؿ ادلقطع الصويت wo ادلرتفع لذلك غلب تعديل مطاالت اإلشارة لكي نزيد من فعالية احلرؼ. t توجد رلموعة من تقنيات ربس ت اإلشارة سبسى ادلرشحات الرقمية ذات ادلركبة الواحدة ويعرب عنها بادلعادلة التالية : ادلعادلة )1-1( : ( ) ( ) ( ) إف ىذا ادلرشح ال يزيد من قيمة مطاؿ عينة إظلا يعدؿ مطاالت كل العينات بطرح قيمة جزئية من كل عينة أي أف ىذا ادلرشح ػلاوؿ مقاربة قيم العينات حبيث ال يكوف تأث ت عينة أكرب من أخرى وؽلثل الوسيط مقدار اعتمادكل عينة على سابقتها وقيمتو ب ت 0 و 1 والقيمة ادلثلى لو ىي [5]. 0.95 بتطبيق ىذه ادلعادلة على اإلشارة السابقة ضلصل على ما يلي : الشكل) 3-1 ( :إشارة الرقم two بعد تعديل ادلطاالت. نالحظ من الشكل السابق أف مطاالت احلرؼ t شكل اإلشارة مل يتغ ت إظلا تغ ت ادلطاؿ األعظمي. أصبحت أكرب وبالتايل أكثر فعالية كما نالحظ أف 39

: 4-1-1 تطبيق مرشح التمرير المرتفع : High pass filter كما ذكرنا يف الفقرات السابقة غلب إزالة ال تددات ادلنخفضة جدا ألهنا سبثل ضجيجا يف اإلشارة وال سبثل أي إشارةكالمية. حلذؼ ىذه ادلركبات ال تددية من اإلشارة نقو بتطبيق مرشح سبرير مرتفع حيث أف ىذا ادلرشح ؽلرر ال تددات اليت ىي أعلى من عتبة معينة أما باقي ال تددات األصغر من ىذه العتبة فيتم حذفها. بالعودة إىل ادلخطط )1-1( صلد أف أغلب ال تددات زلصورة ب ت 100 و Hz 1000 Hz وال تددات ربت 100 Hz ىي ال تددات غ ت ادلرغوبة لذلك نطبق مرشح التمرير على عتبة 100 Hz [ 5 ]وذلك حلذؼ تلك ال تدداتكما يب ت الشكل التايل : الشكل )4-1(: ؽلثل التحليل الطيفي لإلشارة ادلمثلة للرقة nine مع تطبيق مرشح سبرير مرتفع على ىذه اإلشارة 41

نالحظ من الشكل األوؿ أف اإلشارة ربوي ترددات منخفضة ربت عتبة 100 Hz لذلك نقو بتطبيق مرشح سبرير مرتفع على ىذه اإلشارة لتخفيف أثر ىذه ال تددات حيث أف مرشح التمرير ادلرتفع ؼلفف من أثر ال تددات ربت العتبة ويزيد من أثر اليت فوؽ العتبة فنالحظ تع ت الطيف يف الشكل الثاين بعد تطبيق مرشح بعتبة. 100 Hz : : تحديد بداية ونهاية الكالم Speech boundary detection 2-1 يف كت ت من األحياف قد سبر حلظات صمت قبل وبعد التسجيل ىذه اللحظات قد تؤثر على جودة عينة الصوت يف سبييز زلتوى ىذه العينة لذلككاف ال بد من إزالة ىذه العينات الساكنة من اإلشارة واإلبقاء على العينات اليت ربمل معلومات الصوت ادلنطوؽ. : تحليل الطاقة ذو الفترة الزمنية الصغيرة : Short-term energy measure 1-2-1 تعترب ىذه الطريقة من أكثر الطرؽ استخداما يف خوارزميات كشف احلواؼ ألهنا سبكننا من التمييز ب ت ادلقاطع الصوتية و مقاطع السكوف حيث تعتمد ىذه الطريقة ىذه الطريقة على طاقة اإلشارة. توجد عدة طرؽ حلساب طاقة اإلشارة : الطاقة بالشكل اللوغاريتمي : ( ( ) ) ادلعادلة) 2-1 ( : الطاقة بالشكل ال تبيعي )أكثر أشكاؿ حساب الطاقة استخداما (: ادلعادلة) 3-1 ( : ) ( الطاقة بالشكل ادلطلق : ( ) ادلعادلة) 4-1 ( : 40

يف البداية يتم تقطيع اإلشارة إىل إطارات بطوؿ 10 MS وبنسبة تداخل 60% ب ت ىذه اإلطارات مث يتم حساب طاقةكل إطار حسب أحد األشكاؿ الثالث السابقةكما توضح ادلعادلة التالية : ادلعادلة )5-1( : ( ) ( ) ( ) حيث ىو طوؿ اإلطار الذي مت اقتطاعو من اإلشارة بتطبيق نافذة الشكل على مستطيلة اإلشارة ومت حساب الطاقة بالشكل ادلطلق يف ىذه ادلعادلة. بعد تقطيع اإلشارة وحساب طاقة اإلطارات يتم حذؼ كل اإلطارات اليت تكوف طاقتها أقل من عتبة معينة من طاقة اإلشارة الكلية كما يف ادلعادلة : ادلعادلة )6-1( : حيث ؽلثل احلد األدىن لنسبة طاقة اإلطار من طاقة اإلشارة وقيمتو ب ت 0 و 3% ولكن أفضل قيمو ب ت 0 و 1% حيث لو كانت قيمة ىذا الوسيط أكرب من 1% سيتم حذؼ أغلب مركبات اإلشارة وسنخسر كميةكب تة من معلومات اإلشارةكما يب ت ادلخطط التايل : 42

ادلخطط) 2-1 ( : يعرب عن اإلشارة األصلية اإلشارة ادلتقطعة منها عند عتبت ت سلتلفت ت األوىل 0.005 والثانية 0.03 من الشكل األوؿ يف ادلخطط نالحظ وجود مساحات صامتة يف بداية وهناية اإلشارة بتطبيق عتبة 0.5% نالحظ أنو مت احلفاظ على أغلب مركبات الصوت ادلمثلة للكلمة ادلنطوقة يف ىذه اإلشارة ومت التخلص من ادلساحات الصامتةكما يف الشكل الثاين من ادلخطط. أما بالنسبة للشكل الثالث من ادلخطط فنالحظ خسارة كب تة للمعلومات يف ىذه اإلشارة نتيجة تطبيق عتبة دبقدار 3% على ىذه اإلشارة. إف عملية اختيار العتبة تعترب أمرا صعبا بسبب اختالؼ مطاالت األصوات البشرية ب ت حاالت الصراخ واذلدوء وب ت الذكور واإلناث حيث أنو يف حاالت الصراخ واألصوات ادلرتفعة تكوف مطاالت عينات اإلشارة مرتفعة جدا وبالتايل ؽلكن رفع عتبة القطع على عكس األصوات اذلادئة اليت غلب زبفيض العتبة حىت نقلل من البيانات ادلفقودة بالتجريب وجدنا أف أفضل قيمة ىي % 0.5 كعتبة قطع. بتطبيق صبيع ادلراحل السابقة على اإلشارات ادلمثلة لعينات التدريب تصبح ىذه العينات أفضل يف سبييز الكال وؽلكننا القوؿ أننا زبلصنا جزئيا من ضجيج اإلشارة وأصبحت ىذه اإلشارات جاىزة الستخراج السمات ادلميزة ذلا. 43

الفصل الثاني : استخراج السمات Features Extraction : : تحليل المركبات الطيفية Cepstral Analysis 1-2 إفكلمة cepstral ليس ذلا مع ت لغوي إظلا ىي تركيب معكوس لألحرؼ األوىل منكلمة spectral )طيفي( وذلك للداللة على أف ىذه العملية تطبق على طيف اإلشارات ال تددي الستخراج رلموعة ادلركبات اليت سبثل ىذه اإلشارة وكذلك احلاؿ بالنسبة لكلمة cepstrum ىي معكوس لكلمة. spectrum إف أي إشارة ىي عبارة عن استجابة وسط مع ت لكمات من الطاقة اليت ؼلضع ذلا فاإلشارة الصوتية ىي استجابة ادلسار الصويت للطاقة الناذبة عن ضغط اذلواء الناتج عن الرئت ت. e(t) إف استجابة ادلسار h(t) الصويت ذلذه الطاقة ىو ما ػلدد شكل اإلشارة[ 5][3 ] الناذبة وبالتايل الصوت s(t) الناتج phoneme كما يف الشكل : لكمات اذلواء e(t) مع استجابة ادلسار الصويت h(t) تشكيل اإلشارة اإلشارة ادلمثلة الشكل) 1-2 ( : S(t) من تركيب 44

يتم سبثيل ىذه اإلشارة رياضيا باستخدا convolution االلتفاؼ حيث أف اإلشارة الناذبة ىي رلموع التفاؼ إلشارت ت كما يف ادلعادلة : ( ) ( ) ( ) ادلعادلة) 1-2 (: إف اذلدؼ من ربليل أي إشارة ىو احلصوؿ على استجابة الوسط h(t) اليت ربدد ما ىو الصوت ادلنطوؽ. حيث أف ىذه االستجابة ىي لذلك ضلتاج إىل فصل استجابة ادلسار الصويت عن طاقة اإلشارة تعترب ىذه العملية صعبة التطبيق يف رلاؿ الزمن بسبب رلموع االلتفاؼ convolution لذلك ضلتاج إىل ربويل ىذا اجملموع إىل شكل ؽلكن استخالص االستجابة منو فسنستخد ربويل فورييو لنقل اإلشارة إىل رلاؿ ال تدد ونطلق اسم الطيف ال تددي لإلشارة على خرج ربويل فورييو الذي يعطى بادلعادلة : ادلعادلة )2-2( : ( ) ( ) ( ) إف استجابة الوسط )ادلسار الصويت( ىي استجابة بطيئة التغ ت يف الزمن وبالتايل ىي إشارة ذات تردد منخفض وطاقة اذلواء ادلندفع يف ىذا الوسط ىي إشارة سريعة التغ ت وبالتايل ذات تردد مرتفع فباإلمكاف ربويل الضرب إىل صبع خطي لكل من اإلشارت ت وذلك بتطبيق لوغاريتم الطرف تكما يف ادلعادلة : ادلعادلة )3-2(: ( ( )) ( ( ) ( )) ( ( )) ( ( )) إف ىذا اجلمع اخلطي للوغاريتم اإلشارت ت غلعل باإلمكاف احلصوؿ على استجابة الوسط والذي ضلصل عليو بتطبيق ربويل فورييو العكسي على ادلعادلة )3-2( فنحصل على ادلركبات الطيفية ادلمثلة إلشارة الصوت ادلدخل. 45

أي أنو بتطبيق ربويل فورييو العكسي على لوغاريتم الطيف ال تددي لإلشارة S(f) ضلصل على ادلركبات الطيفية ادلمثلة ذلذه اإلشارة واليت نطلق عليها real cepstrum ىذه اإلشارة أي أف القسم احلقيقي من ربويل فورييو العكسي ىو ىذه ادلركبات. ؽلكن تلخيصكل العمليات السابقة بادلعادلة : ادلعادلة )4-2( : ( ) ( ) أي أف التحليل الطيفي للمركبات : cepstral analysis ىو زلاولة احلصوؿ على ادلركبات اليت سبثل استجابة الوسط للطاقة ادلقدمة من ادلنبع حيث تعترب ىذه ادلركبات ىي القسم احلقيقي من ربويل فورييو العكسي ادلطبق على لوغاريتم الطيف ال تددي لإلشارة وذلككما يوضح الشكل التايل : الشكل )2-2( : يوضح مراحل ربليل ادلركبات ادلمثلة لإلشارة للحصوؿ على ادلركبات ادلمثلة الستجابة اإلشارة 46

: 2-2 تقنية Coefficients(MFCC) Mel Frequency Cepstral الستخراج السمات : تعترب ىذه التقنية من أكثر التقنيات شيوعا يف استخراج السمات ادلميزة للصوت يف نظم التعرؼ على الكال وذلك بسبب دقة نتائجها والقدرة على التخلص اجلزئي من ضجيج اإلشارة وكذلك سرعة تطبيقها وسهولتو كما أنو يف ىذه التقنية تتم مقاربة عملية السمع عند اإلنساف أي زلاولة استخراج مسات اإلشارة بشكل يتوافق تقريبا مع آلية السمع عند اإلنساف حيث أف األذف البشرية حساسة لل تددات ادلنخفضة ربت 1000 Hz وضعيفة احلساسية لل تددات ادلرتفعة فوؽ 1000 Hz لذلك فإف ىذا السلوؾ جعل باإلمكاف تطبيق رلموعة معينة من ادلرشحات على اإلشارة لكل مرشح رلاؿ ترددي مع ت [5][3][7]. تسلك ىذه ادلرشحات سلوكا خطيا من أجل ال تددات ادلنخفضة وسلوكا لوغاريتميا من أجل ال تددات ادلرتفعة ( أي تتم زيادة عرض اجملاؿ ال تددي للمرشح بشكل خطي من أجل ال تددات ادلنخفضة ربت 1000 Hz وبشكل لوغاريتمي من أجل ال تددات ادلرتفعة فوؽ 1000( Hz والسبب يف تصميم ادلرشحات هبذا الشكل ىو أف األذف غ ت حساسة لل تددات ادلرتفعة وبالتايل يكمن تقليل عدد ادلرشحات ادلميزة ذلذه ال تددات. يطلق على ىذه ادلرشحات Mel Scale وتكوف عبارة عن رلموعة من اإلشارات ادلثلثية سبثل كل إشارة مرشحا جملاؿ ترددي سلتلف وؽلكن التعب ت عن مراكز ىذه ادلرشحات بادلعادلة : ادلعادلة )5-2( : ( ) 47

الشكل) 3-2 (: يوضح ادلرشحات ال تددية ادلستخدمة يف mfcc واليت تسمى Mel scale تعتمد تقنية MFCC على أسلوب التحليل الطيفي للمركبات[ 7 ] Cepstral Analysis اليت تعرفنا عيلها سابقا باإلضافة إىل تطبيق رلموعة ادلرشحات اليت ربدد استجابة اإلشارة من أجل رلاالت ترددية سلتلفة وبالتايل ؽلكن حصر رلاؿ ترددات اإلشارة ومركباهتا يف ادلرشحات اليت تكوف استجابة اإلشارة ذلذه ادلرشحات مرتفعة وتصبح السمات الالزمة لتمثيل ىذه اإلشارة أقل. : : مراحل عمل تقنية MFCC 3-2 يف MFCC سبر اإلشارة الصوتية بعدد من ادلراحل [ 4 ]اليت تكوف نتيجتها ىي السمات ادلميزة ذلذه اإلشارة إف ىذه ادلراحل تتم بال تتيب ادلوضح يف ادلخطط التايل : الشكل) 4-2 (: سلطط يوضح مراحل عمل تقنية MFCC الستخراج السمات 48

: تقسيم اإلشارة إلى إطارات : Frame Blocking 1-3-2 إف أوؿ مرحلة يف استخراج السمات باستخدا MFCC ىي تقسيم اإلشارة إىل إطارات يكوف الدخل ىو اإلشارة الصوتية واخلرج ىو اإلطارات ادلوافقة ذلذه اإلشارة حيث أف كل إطار من ىذه اإلطارات يعاجل بشكل مستقل عن بقية اإلطارات واذلدؼ األساسي من عملية التقسيم ىذه ىو حساب السمات ادلوافقة لتغ ت اإلشارة بالنسبة للفاصل الزم ت الذي ػلدده طوؿ اإلطار بعبارة أوضح : إف كل إطار يقابل رلموعة من عينات اإلشارة فيتم حساب السمات ادلوافقة ذلذه العينات وبالتايل تتم مراعاة تغ تات اإلشارة مع الزمن. يتم تقسيم ىذه اإلشارة تبعا لطوؿ إطار مع ت ( يف حبثنا ىذا استخدمنا طوؿ إطار ) 40 ms مع حساب تداخل ب ت اإلطارات وذلك دلراعاة ارتباط بعض العينات ببعضها البعض واليت قد تتبع لنفس ادلقطع الصويت يفكلمة معينة استخدمنا يف ىذا البحث تداخل بنسبة 60% ب تكل إطارين. : تطبيق النافذة : Windowing 2-3-2 إف دخل ىذه ادلرحلة ىو اإلطارات الناذبة من مرحلة التقسيم وخرجها ىو اإلطارات بعد تطبيق النافذة عليها حيث يتم تطبيق نافذة على كل إطار وتكوف ىذه النافذة ذات قيم منخفضة عند احلواؼ ومرتفعة يف ادلنتصف وذلك حلصر التغ تات الطيفية يف رلاؿ مع ت ومنع التشوىات اليت قد تظهر عند أطراؼ النافذة أي يتم ال تكيز على طيف اإلشارة ادلوافق دلنتصف النافذة. إف أفضل النوافذ وأكثرىا استخداما يف MFCC ىي نافذة hamming واليت تعطى بادلعادلة : ادلعادلة )6-2(: ( ) { ( ) حيث أف N ىي عدد عينات النافذة. 49

الشكل) 6 (:نافذة ىامينغ من أجل طوؿ إطار 40 ms : 3-3-2 تحويل فورييه السريع Transform(FFT) : Fast Fourier تعرفنا على ربويل فورييو وخصائصو يف الفصل السابق)األدوات ادلستخدمة يف ىذا البحث( نطبق ربويل فورييو على خرج النوافذ حلساب الطيف ال تددي لكل إطار والذي يعترب دخل مرحلة ادلرشحات ال تددية. : تطبيق المرشحات الترددية : Mel Frequency Warping 4-3-2 ؽلكن اعتبار ادلراحل الثالث السابقة مش تكة ب ت أغلب تقنيات استخراج السمات الصوتية حيث تعترب ىذه ادلرحلة ىي البداية الفعلية الستخراج السمات باستخدا. MFCC كما سبق وأوضحنا إف تقنية MFCC رباوؿ زلاكاة آلية استجابة األذف لل تددات حيث أف األذف حساسة لل تددات ادلنخفضة بشكل أكرب من حساسيتها لل تددات ادلرتفعة لذلك ومن أجل كل الطيف ال تددي لكل إطار نقو بتطبيق رلموعة من ادلرشحات ال تددية bank) (filter على ىذا الطيف بغية حساب استجابة ىذا الطيف ذلذه ادلرشحات )حيث أف االستجابة ىي مقدار التوافق ب ت ادلرشح واإلشارة وىي حاصل 51

ضرب قيم ال تددات ادلمثلة لإلشارة مع القيم ادلمثلة للمرشح وكلما زاد ىذا اجلداء كاف التوافق أكرب بكلمات أخرى االستجابة ىي طاقة اإلشارة يف ىذا ادلرشح ). إف ىذه ادلرشحات ؽلكن أف سبثل بأي تابع رياضي ولكن األفضل يف MFCC أف يكوف ادلرشح مثلثي الشكلكما ىو موضح بالشكل )3-2( ولكل مرشح تردد مركزي يعطى حسب ادلعادلة : ( ) حيث أنو ومن خالؿ ىذا ال تدد يتم ربديد عرض ادلرشح أي رلاؿ ال تددات اليت يسمح بتمريرىا. إف خرج ىذه ادلرحلة ىو االستجابات ال تددية للمرشحات اليت تعترب دخال للمرحلة التالية وىي ادلرحلة اليت يتم فيها فصل طاقة االشارة عن استجابة ادلسار الصويت. Log Energy : 5-3-2 تطبيق اللوغاريتم على خرج المرشحات )حساب الطاقة اللوغاريتمي ) :Computation إف MFCC تقنية تعتمد على التحليل الطيفي للمركبات Cepstral Analysis الستخراج السمات كما أشرنا وشرحنا سابقا يف ىذا الفصل حيث أنو يتم تطبيق اللوغاريتم )حساب الطاقة اللوغاريتمي( على خرج ادلرشحات ال تددية وذلك يؤدي إىل تسهيل احلصوؿ على استجابة ادلسار الصويتكما سبق وأوضحنا يف التحليل الطيفي للمركبات حيث أف ىذه االستجابة ىي اليت سبثل شكل ادلقطع الصويت )phoneme( ادلنطوؽ وبالتايل ىذه االستجابة ىي ما يهمنا يف اإلشارة حيث يعطى خرج ىذه ادلرحلة بادلعادلة : ( ( )) ( ( ) ( )) ( ( )) ( ( )) : تطبيق التحويل الجيبي المتقطع (DCT) : Discrete Cosine Transform 6-3-2 يف ىذه ادلرحلة يتم حساب ادلركبات اليت سبثل كل إطار ( coefficients )cepstral ادلركبات ىي السمات ادلميزة لإلشارة )بعد التجريب مت اختيار 13 مركبة لتمثيلكل إطار (. حيث أف ىذه 50

كما تعرفنا سابقا يف التحليل الطيفي للمركبات أنو بتطبيق ربويل فورييو العكسي على لوغاريتم اإلشارة فإف القسم احلقيقي من ىذا التحويل ؽلثل ادلركبات ادلمثلة ذلذه اإلشارة. إف ربويل DCT ؽلثل القسم احلقيقي من ربويل فورييو ىذه ادلركبات اليت سبثل اإلشارة[ 7 ]. وبالتايل ؽلكن تطبيق ىذا التحويل للحصوؿ على : مالحظات حول السمات المميزة لإلشارة : 7-3-2 a. بالتجريب مت التحقق من أف ادلركبة األوىل غلب أف ربذؼ من ادلركبات )السمات( ادلميزة ألي إشارة ألف ىذه ادلركبة سبثل متوسط الطاقة يف اإلشارة )بعبارة أدؽ متوسط لوغاريتمات استجابة اإلطار يف كل مرشح ) واليت ؽلكن أف تؤثر يف عملية التدريب بنتائج سلبية وبالتايل نستخد فقط 12 مركبة يف سبثيل كل إطار[ 5 ]. b. ؽلكن أف تؤثر بعض األخطاء اليت قد توجد يف عينات الصوت ادلسجل على جودة السمات ادلستخلصة من ىذه اإلشارة لذلك ؽلكن تصحيح ىذه السمات وذلك بطرح متوسط قيم ادلركبات من ىذه القيم وذلك من أجل كل إطار شلا ؽلكن من زيادة تأث ت ىذه السمات يف التعرؼ على الصوت الذي سبثلو.[5] c. توجد عمليات إضافية تسعى لتعديل السمات ادلستخرجة باستخدا MFCC حيث أنو تعترب السمات ادلستخرجة باستخدا MFCC غ ت كافية لتقو بتمثيل اإلشارات الصوتية دبفردىا وذلك ألف ىذه السمات تلغي ال تابط ب ت مسات كل إطار واإلطارات اليت ذباوره[ 5 ] إف ىذا ال تابط يعرب عن تغ ت ىذه السمات مع تقد اإلشارة وبالتايل نقو بتطبيق عمليات على ىذه ادلركبات الشتقاؽ مركبات أخرى تضاؼ إليها شلا يزيد من فعالية ىذه ادلركبات يف عملية التعرؼ على اإلشارة الصوتية اليت سبثلها ىذه ادلركبات. من ب ت ىذه العمليات ما يسمى عملية liftering واليت يتم من خالذلا اشتقاؽ مركبات جديدة تساىم يف سبثيل اإلشارة وذلك بإعادة وزف مركبات MFCCباستخدا توابع رياضية معينة لزيادة قيم ىذه ادلركبات شلا يزيد من فعاليتها يف التعرؼ على زلتوى اإلشارة. 52

الفصل الثالث التكميم الشعاعي وتوليد الفهرس Vector Quantization & Generating Codebook مقدمة : حىت ىذه ادلرحلة نكوف قد حصلنا على السمات ادلميزة االستخدا ادلباشر ذلذه السمات ليس شلكنا لعدد من األسباب لكل إشارة دخل يف نظامنا الصويت ولك ن : يف نظم التعرؼ على األشكاؿ pattern recognition )واليت يعترب نظامنا جزءا منها ) ضلتاج أف تكوف قيم البيانات ذات داللة معينة أي غلب أف ؽليز اإلطار بقيمة ما ىذه القيمة ؽلكن أف تؤخذ من فهرس ؽلثل قيما لكل اإلطارات يف بيانات التدريب واالختبار اليت حبوزتنا. بسبب العدد الكب ت لإلطارات اليت تكوف قيم السمات فيها متقاربة فيمكن اختصار ىذه السمات جبدوؿ مع ت ؽلثل فهرسا ذلذه اإلطارات وقيم السمات ادلمثلة ذلا [5][3]. )a )b ذلذه األسباب ال ؽلكن التعامل مع اإلطارات ومساهتا بشكل مباشر حيث غلب أف نقو بتحويلها إىل الشكل ادلناسب ليكوف دخال لنماذج ماركوؼ ادلخفية. تسمى عملية التحويل ىذه بالفهرسة وىي عملية يتم من خالذلا إعطاءكل إطار من اإلطارات اليت سبثل اإلشارات الصوتية قيمة سبيزه عن غ ته من العناصر حبيث نستخد ىذه القيمة للداللة على ىذا اإلطار وتصبح ىذه القيمة ىي دخل لنماذج ماركوؼ ادلخفية. 53

: : التكميم الشعاعي (VQ) Vector Quantization 1-3 تعترب تقنية التكميم الشعاعي Vector Quantization من أشهر التقنيات اليت تستخد يف رلاؿ الفهرسة بالنسبة للعينات الصوتية وأكثرىا شيوعا وذلك دلا ذلا من استخدامات متعددة يف رلاالت ضغط الصوت والتعرؼ على الكال وادلتكلم حيث زاد استخدا ىذه التقنية منذ بدء استخدا تقنية التنبؤ اخلطي LPC يف ستينيات القرف ادلاضي[ 5][3 ]. تقو فكرة التكميم الشعاعي على إعطاء إشارة معينة ذات قيم مستمرة قيمة فريدة من ب ت رلموعة من القيم حبيث ال يكوف إلشارت ت سلتلفت ت نفس القيمة وتكوف اإلشارات ادلتقاربة وادلتشاهبة ربمل نفس ىذه القيمة. نالحظ من الكال السابق أف عملية التكميم الشعاعي تساىم يف اختصار التكرار للعناصر ادلتشاهبة حبد [ ( ) ( ) ( ىو وحيد ؽلثل ىذه العناصر على سبيل ادلثاؿ لنفرض لدينا الشعاع ] ) شعاع ذو L بعد حيث أف قيم ىذا الشعاع الشعاعي ذلذا الشعاع يتم مطابقة ىذا الشعاع مع شعاع اخر y يكوف تابع التكميم للشعاع x ىو : ادلعادلة )1-3(: ( ) ( ) ذو L ىي قيم حقيقة مستمرة بالتكميم بعد شلثل بقيم حقيقية منفصلة حبيث إف ىذا الشعاع y ىو عنصر من رلموعة من األشعة Y اليت غلري حساب اختالؼ الشعاع x عن كل عنصر من ىذه اجملموعة والعنصر األكثر تشاهبا مع x يعترب ىو ناتج تكميم x حيث أف عدد عناصر اجملموعة Y ىو k وكل عنصر منهاكما سبق وذكرنا ىو شعاع بطوؿ. L إف اجملموعة Y تسمى Code Book أو الفهرس وكل عنصر منها يسمى Code Vector أو Code Word أو كلمة ترميز حيث أف ىذه العناصر تكوف سلتلفة وال يوجد بينها أي ترابط وىنا تكمن فائدة التكميم الشعاعي اليت تسعى حملاولة سبثيل أي إشارة ( حيث أف كل إشارة مت تقسيمها إىل إطارات يف مرحلة 54

استخراج السمات ) دبجموعة من اؿ Code Vectors ادلميزين وبالتايل فإف كل Code Vector سيمثل رلموعة من اإلطارات اليت توجد بالقرب )أي األكثر مشاهبة ) من ىذا الشعاع وبعبارة أخرى كل شعاع سيثمل عنقودا من األشعة اجملاورة. لبناء وتوليد الفهرس أو Code Book نقو بتقسيم الفضاء إىل k منطقة أو عنقود وكل منطقة حيث C j ىو * + زلددة بشعاع بطوؿ Lعنصر Vector( )Code حبيث يكوف : عنقود و y j ىو الشعاع ادلميز لو. x غلب أف ينتمي الشعاع x للعنقود C j ويكوف : حىت يكوف الشعاع y j ىو الناتج التكميمي للشعاع ادلعادلة )2-3( : ( ) حىت تتحقق ادلعادلة )2-3( غلب أف يكوف الشعاع x مقاربا )خبطأ مع ت يسمى خطأ التكميم ) للشعاع. توجد عدة طرائق حلساب التقارب بالعالقة: ولكن أشهرىا وأفضلها ىي ادلسافة اإلقليدية ب ت شعاع ت واليت تعطى ادلعادلة )3-3( : ( ) ( ( ) ( ) ). y ( ) ( ) علا ادلركبة و حيث أف من الشعاع ت x و لبناء الفهرس أو فإننا ضلتاج إىل خوارزمية عنقدة تقو بتجميع العناصر ادلتقاربة وتوجد Code Book الشعاع ادلمثل ذلا. 55

أفضل اخلوارزميات وأكثرىا استخدما يف ىذا اجملاؿ ىي خوارزمية K-Means فضاء بيانات التدريب إىل عناقيد لتحقيق شرطي األمثلية التالي ت : [ 3][5 ]واليت تقسم الشرط األول : كل عنصر من بيانات التدريب غلب أف يكوف قريبا من عنقود مع ت وبعيدا عن بقية العناقيد بعبارة أخرى غلب أف يكوف العنصر ينتمي إىل عنقود واحد فقط حبيث تكوف ادلسافة ب ت ىذا العنصر ومركز العنقود أصغر منكل ادلسافات األخرىكما توضح ادلعادلة:.I ادلعادلة )4-3( : ( ) ( ) ( ( ) ) ( ( ) ) حيث أف العنقود ىو كل العناصر اليت تكوف مسافتها عن عنصر مع ت أصغر من كل ادلسافات عن العناصر األخرىكما يف ادلعادلة التالية : ادلعادلة )5-3( : * +.II الشرط الثاني : غلب اختيار مركز العنقود حبيث يكوف بعد ىذا ادلركز عن كل العناصر أقل ما ؽلكن أي غلب زبفيض قيمة متوسط اخلطأ )البعد عن ادلركز ) لكل عنقود. إف مركز العنقود ىو متوسط القيم اليت تنتمي ذلذا العنقودكما يف ادلعادلة : ادلعادلة )6-3(: ( ) :1-1-3 خوارزمية :[2] K-Means كما ذكرنا سابقا يتم تقسيم فضاء البيانات إىل K عنقود حيث أف ىذا العدد يتم اختياره مسبقا إف خوارزمية LBG ىي ظلوذج خوارزمية K-Means ادلطبق يف عملية Vector Quantization واليت اق تحها كل من Linde,Buzo,Gray والذين مسيت بأمسائهم على ال تتيب. 56

اذلدؼ من تطبيق ىذه اخلوارزمية ىو تشكيل العناقيد ادلمثلة للبيانات و االشعة ادلمثلة ذلذه العناقيد باستخدا بيانات التدريب دبحاولة زبفيض متوسط الفروؽ إىل أقل نسبو حيث يتم البدء ببيانات عشوائية مقتبسة من عناصر التدريب مث يتم تطبيق الشرط ت الضروري ت يف بناء اؿ Code Book اللذين تعرفنا عليهما سابقا ويتم تكرار ىذا التنفيذ حىت نصل إىل قيمة خطأ معينة تعترب احلد ادلسموح للخطأ أو نصل إىل عدد أعظمي من التكرارات : يوضح ادلخطط التايل خوارزمية LBG الشكل) 1-3 (: سلطط توضيحي دلراحل عمل خوارزمية LBG يف التكميم الشعاعي 57

وفيما يلي شرح دلراحل تطبيق ىذه اخلوارزمية : : Initialization التهيئة يتم يف ىذه ادلرحلة ربديد عدد العناقيد K واختيار عناصر مبدئية لتمثيل ىذه العناقيد حيث أنو يتم اختيار ىذه العناصر عشوائيا من بيانات التدريب وذلك من أجل كل عنقود C j حيث.,1,2=j.,. k ويعترب كل عنصر ىو مركز ذلذا العنقود. y j : Search Nearest Neighbor البحث عن أقرب مجاور يف ىذه ادلرحلة يتم حساب بعد كل عنصر من بيانات التدريب عن كل ادلراكز إلغلاد أقرب مركز ذلذا العنصر كما يف ادلعادلة : ( ( )) ادلعادلة )7-3(: حيث d ىي ادلسافة االقليدية ب ت العنصرين. : Compute Euclidean distance حساب المسافة نقو حبساب اجملموع الكلي للمسافات من أجل ىذا التكرار والذي ؽلثل مقدار اخلطأ يف ىذا التكرار. : Update Centroids تحديث المراكز نقو بتحديث ادلراكز حيث يتم حساب متوسط قيم العناصر األقرب ذلذا ادلركز واليت نتجت يف اخلطوة )2( ويعترب ىذا ادلتوسط ىو ادلركز اجلديد للعنقود. :Termination التوقف نكرر اخلطوات السابقة)عدا التهيئة ) إىل حد احلصوؿ على خطأ يف اخلطوة 3 أقل من حد مع ت يتم ربديده سابقا او حىت الوصوؿ إىل عدد أعظمي من الدورات. عند انتهاء ىذه اخلوارزمية نكوف قد حصلنا على العناقيد النهائية والعناصر اليت سبثلها وربقق أفضل بعد وأقل نسبة خطأ شلكنة. 58

: 2-3 تطبيق التكميم الشعاعي على سمات الكالم وتوليد الفهرس Code Book :generating كما أوضحنا سابقا إف ظلاذج ماركوؼ ادلخفية ال تتعامل إال مع قيم منفصلة )غ ت م تابطة ) [ 5 ]وىي اليت سبثل سالسل ادلالحظات اليت تعترب دخل لنموذج ماركوؼ لذلك فعند استخدا ظلاذج ماركوؼ للتعرؼ على الكال ال بد من ربويل خرج السمات إىل الشكل ادلقبوؿ يف ىذه النماذج وذلك بتطبيق التكميم الشعاعي حيث أنو وباستخدا فهرس مت بناؤه مسبقا يعطىكل إطار قيمة من ىذا الفهرس. باستخدا التكميم الشعاعي نستطيع توليد الفهرس Code Book حيث أنو بعد استخراج مسات بيانات التدريب تصبح ىذه البيانات على شكل إطارات وكل من ىذه اإلطارات ػلوي السمات اخلاصة بو أي يكوف لدينا T شعاع كل منها ؽلثل إطار وF مسة لكل إطار حيث وكما وجدنا يف الفصل السابق أف عدد السمات ىو ( 24 MFCC ) 12 MFCC & 12 liftering وبالتايل يكوف لدينا مصفوفةكل عمود فيها ؽلثل إطار. يف البداية غلب ربديد حجم الفهرس Code Book أي عدد العناقيد K اليت سيتم تكميم اإلطارات من خالذلا ومن مث نطبق خوارزمية K-Means كما يف السابق حيث نقو بتهيئة الفهرس ب Kشعاع سلتار عشوائيا من مصفوفة التدريب فتعترب ىذه األشعة ىي ادلراكز االبتدائية وكل منها ب 24 بعد. نبحث لكل شعاع يف مصفوفة التدريب عن أقرب شعاع لو من ب ت أشعة الفهرس ويعطى ىذا الشعاع)ادلوجود يف مصفوفة التدريب( القيمة اليت تدؿ على موقع شعاع التكميم أو العنقود الذي يتبع لو ويتم صبع ادلسافات اليت حصلنا عليها يف ىذه ادلرحلة لتمثل اخلطأ الكلي من أجل ىذا التكرار. بعد اإلسناد يتم حساب متوسط قيم مركبات األشعة اليت ربمل نفس القيمة من الفهرس )أي األشعة اليت تنتمي لنفس العنقود( وىذا ادلتوسط ؽلثل مركز العنقود اجلديد أي الشعاع الذي سنقارف معو القيم ويتم تكراركل اخلطوات السابقة حىت يصبح الفرؽ ب ت ادلركز القد ن وادلركز اجلديد مساويا للصفر. 59

يف هناية تطبيق اخلوارزمية نكوف قد حصلنا على ادلراكز النهائية اليت ستقو بتحويل سلسلة اإلطارات ادلمثلة إلشارة صوتية إىل سلسلة من القيم سبثل ادلالحظات اليت سيتم إدخاذلا إىل ظلوذج ماركوؼ ادلخفي كما يوضح الشكل التايل : الشكل) 2-3 (: ؽلثل بناء الفهرس باستخدا K-Means واستخدا ىذا الفهرس يف التكميم الشعاعي الستخراج دخل ظلوذج ماركوؼ ادلخفي كما سبق وذكرنا غلب ربديد حجم الفهرس قبل إي عدد العناقيد K قبل البدء بتطبيق اخلوارزمية حيث أف عدد العناقيد يؤثر على مقدار التعرؼ على الكال يف ظلاذج ماركوؼ ادلخفية. ال توجد طريقة معينة لتحديد عدد العناقيد حيث أنو زبتلف طريقة التحديد تبعا لغرض النظا وبشكل عا يتم اختيار عدد العناقيد حبيث يكوف بعد أي شعاع من بيانات التدريب عن مركز العنقود أصغر ما ؽلكن حيثكلما قل ىذا البعدكلماكانت نتائج التدريب أفضل وأدؽ. كما غلب أف يكوف عدد ادلراكز أكرب من عدد ادلقاطع الصوتية يف الكلمات ادلستخدمة يف ىذا النظا لزيادة الدقة [5]. يف نظامنا ىذا كاف عدد العناقيد 130 حيث أف أفضل نتائج التدريبكانت من أجل 130 عنقود. 61

الفصل الرابع Hidden Markov Model (HMM) مقدمة : ظلوذج ماركوؼ ادلخفي ىو ظلوذج إحصائي قوي أثبت قدرتو يف رلاؿ التنبؤ والتعرؼ بسبب قوة تراكيبو الرياضية ومستخد بكثرة يف تطبيقات ظلذجة اإلشارة. وجدت لنماذج ماركوؼ العديد من التطبيقات يف اجملاالت ادلهتمة دبعاجلة اإلشارة مثال معاجلة الكال. كما أهنا صلحت يف تطبيقات معاجلة اللغات الطبيعية يف مستوى منخفض مثل تصنيف أقسا الكال تقطيع العبارات واستخراج ادلعلومات اذلدؼ من وثائق. آندري ماركوؼ )A.Markov( قد امسو للنظرية الرياضية عمليات ماركوؼ (Markov Proccess) يف أوائل القرف العشرين ولكن باو )Baum( وزمالئو من قاموا بتطوير نظرية ظلاذج ماركوؼ ادلخفية )HMM( يف عا 1960. : سالسل ماركوف المالحظة والمخفية : 1-4 سالسل ماركوؼ ىي عملية عشوائية)عائلة من ادلتغ تات العشوائية( ربمل خاصية تسمى باخلاصية ادلاركوفية حيث يف ىذه العملية ؽلكن تنبؤ ادلستقبل اعتمادا على ادلاضي ادلتمثل يف احلاضر أي ال يوجد حاجة دلعرفة ادلاضي للتكهن بادلستقبل بل يكفي معرفة احلاضر. 60

أما بالنسبة لنماذج ماركوؼ ادلخفية فهي عملية عشوائية مزدوجة تتمثل يف مستوي ت اثن ت: ادلستوى األوؿ أو الطبقة األوىل ىي الطبقة العليا ادلخفية وتتمثل بعملية ماركوؼ حباالت ال ؽلكن مالحظتها )عملية ذات حاالت سلفية( ومن ىنا جاءت التسمية بادلخفية. وادلستوى الثاين ىو ادلشاىدات وىو خرج احلاالت السابقة يف احلقيقة ادلالحظات )ادلشاىدات( عبارة عن تابع احتمايل بالنسبة للمستوى ادلخفي حاالت عملية ماركوؼ ادلختلفة ستنتج ادلالحظات اخلرج باحتماليات سلتلفة. : 1-1-4 عمليات ماركوف : Markov processes لنستعرض ادلثاؿ التايل عن عملية ماركوؼ والنموذج ادلقد يصف ظلوذج بسيط دلؤشر سوؽ األسهم. يف النموذج ثالث حاالت bull( ) even bear وثالث مالحظات up(.)unchanged down شكل) 1-4 ( عملية ماركوؼ مثال إذا صادفنا سلسلة ادلالحظات التالية:[ up-up-down ] فباإلمكاف بسهولة معرفة احلاالت ادلوافقة [bull-bull-bear] حيث كل مالحظة خرج ترتبط حبالة واحدة فقط. 62

: 2-1-4 نماذج ماركوف المخفية : الشكل التايل يقد مثاال عنكيفية توسيع ادلثاؿ السابق اىل HMM النموذج اجلديد يسمح جلميع ادلالحظات أف تصدر من صبيع احلاالت باحتماليات زلددة[ 1 ]. ىذا التغي ت غلعل النموذج اجلديد معربا أكثر وؽلكنو من سبثيل احلدس بطريقة أفضل. الشكل( 2-4 ) ظلوذج ماركوؼ ادلخفي يف ىذه احلالة ؽلكن ؿ bull market أف ؽلر بأيا جيدة وأيا سيئة ولكن األيا اجليدة أكثر غالبا. االختالؼ الرئيسي ىنا أننا إذا علمنا سلسلة ادلالحظات السابقة نفسها فإنو ال ؽلكن معرفة سلسلة احلاالت اليت ول دت ىذه ادلالحظات وذلذا فإف سلسلة احلاالت سلفية) Hidden (. وعلى أية حاؿ ؽلكننا القيا باحلسابات دلعرفة احتمالية إنتاج النموذج للسلسلة)ادلالحظات( وأيضا معرفة سلسلة احلاالت اليت على األرجح ول دت ىذه السلسلة. 63

: مثال توضيحي [1]: 3-1-4 لنفرض لدينا N وعاءكب ت ويفكل منها يوجد عدد من الكرات ادللونة. لنفرض أنو يوجد M لوف سلتلف للكرات يف ىذه األوعية. T يقو شخص ما بالعملية التالية للحصوؿ على سلسلة من ادلالحظات: مرة إف ؼلتار الشخص وعاء ما عشوائيا ويسحب منو كرة ويسجل لوهنا مث يعيدىا ويكرر ىذه العملية اختيار الوعاء التايل يكوف وفق عملية عشوائية اعتمادا على الوعاء احلايل)عملية ماركوؼ(. يف النهاية ضلصل على سلسلة من ألواف الكرات ادلسحوبة)ادلالحظات(. غلب مالحظة أنو يف ىذه العملية حاالت النموذج ىي أوعية الكرات )N وعاء( وخرجكل حالة ىي ادلالحظات ادلتمثلة بألواف الكرات )M لوف زلتمل( وزبتلف احتمالية خرج كل لوف يف كل حالة واختيار الوعاء التايل )االنتقاؿ اىل احلالة التالية( يتم عن طريق مصفوفة احتماالت االنتقاؿ. الشكل) 3-4 ( مثاؿ األوعية والكرات ادللونة 64

: : رموز النموذج )عناصر )HMM 2-4 N a. عدد احلاالت الكلي يف النموذج أو النظا.على الرغم أف احلاالت سلفية إال أنو يف العديد من التطبيقات صلد دالالت فيزيائية مرتبطة هبذه احلاالت )يف ادلثاؿ السابق ظلثلكل حالة بوعاء([ 1 ]. بشكل عا فإف احلاالت متصلة ببعضها بشكل يسمح الوصوؿ من أي حالة اىل أخرى بشكل مباشر. نرمز اىل احلاالت ادلستقلة بػ: + * M b. عدد رموز ادلشاىدات وادلالحظات ادلمكنة يف النموذج. وسبثل ادلشاىدات خرج النظا الذي ذبري ظلذجتو )يف مثاؿ األوعية ألواف الكرات ىي ما نالحظو([ 1][5 ]. نرمز اىل ادلالحظات ادلستقلة بػػ : + *. : A= {a ij } التوزع االحتمايل لالنتقاالت ب ت احلاالت.c ادلعادلة )1-4( :, - التوزع االحتمايل لرموز اخلرج)ادلشاىدات(: ادلعادلة )2-4( : توزع احلالة البدائية: * ( )+ * ( )+, -.d.e ادلعادلة )3-4( : التعريف االصطالحي لنموذج ماركوؼ ادلخفي يعطى بالشكل: π * +, - ( ) 65

3-4: توليد مالحظات من النموذج: مالحظات: بإعطاء قيم مناسبة لكل من البارام تات السابقة ؽلكن استخدا النموذج الناتج لتوليد سالسل وذلك وفقا لإلجراء التايل: 1- Choose an initial state q 1 =S i according to initial state distribution π. 2- Set t= 1 3- Choose O t =V k according to the symbol probability distribution in state S i, i.e.,b i (k). 4- Transit to a new state q t+1 =S j according to the state transition probability distribution for state S i, i.e.,a ij. 5- Set t = t+1; return to step 3 if t < T; otherwise terminate the procedure. : المسائل الثالث األساسية في نموذج ماركوف المخفي : 4-4 إذاكاف لدينا ظلوذج HMMكما درسناه سابقا فإننا صلد ثالث مسائل أساسية هنتم بإغلاد احللوؿ ذلا ليصبح النموذج ذو فائدة يف تطبيقات حقيقية وىذه ادلسائل [ 1][3][5 ]ىيكالتايل: 66

.λ= (A, B, π) مسألة- 1 : إذا علمنا سلسلة ادلالحظات. T O=O 1,O 2, O والنموذج كيف ؽلكن حساب االحتماؿ ( P(O λ )احتمالية سلسلة ادلالحظات من النموذج(. مسألة- 2 : إذا علمنا سلسلة ادلالحظات O والنموذج λ. كيف ؽلكن إغلاد السلسلة Q=Q 1,Q 2, Q T. سلسلة احلاالت ادلوافقة ادلثالية اليت تعرب اخلرج أو عن ادلالحظات يف السلسلة O. مسألة- 3 : كيف ؽلكن ضبط أو تعديل بارام تات النموذج (π =λ,a),b جلعل االحتماؿ P(O λ) أعظم ما ؽلكن اذا ما علينا فعلو اآلف ىو البحث عن حلوؿ ادلسائل السابقة جلعل النموذج فعاال يف التطبيقات العملية. سنقد بداية شرحا مبسطا ذلذه ادلسائل لنتمكن من فهمها بشكل أدؽ. 1-4-4: شرح المسائل الثالث لHMM : ادلسألة األوىل وتدعى دبسألة التقييم أو مسألة التقدير دبعرفة النموذج وسلسلة مشاىدات كيف ؽلكن حساب احتماؿ تولد تلك السلسلة من ىذا النموذج. بكال آخر حساب مدى مطابقة النموذج مع السلسلة ادلعطاة. إف التعريف الثاين مفيد جدا. على سبيل ادلثاؿ اذا اعتربنا أننا نريد االختيار من عدة ظلاذج متنافسة فإف حل ادلسألة األوىل يتيح لنا اختيار النموذج ذو ادلطابقة األفضل مع سلسلة ادلشاىدات. ادلسألة الثانية وىنا نريد الكشف عن اجلزء ادلخفي من النموذج أي إغلاد سلسلة احلاالت الصحيحة. غلب أف يكوف واضحا أنو يف صبيع احلاالت ال يوجد تسلسل"صحيح" للحاالت مت العثور عليو لذلك يف حاالت عملية نستخد معيار ادلثالية حلل ىذه ادلشكلة على أفضل شكل شلكن. لألسفكما سنرى يوجد عدة معاي ت مثالية يكن فرضها وبذلك اختيار ادلعيار وظيفة قوية من ادلقصود استخدامها لكشف سلسلة احلاالت..i.ii 67

االستخدا النموذجي حلل ىذه ادلسألة قد يكوف للتعرؼ على ىيكلية النموذج إلغلاد سلسلة احلاالت ادلثالية يف تطبيق التعرؼ على الكال ادلستمر وغ تىا. ادلسألة الثالثة ىي ادلسألة اليت نسعى حبلها لتحس ت بارام تات النموذج لتصف بأفضل شكل شلكن سلسلة ادلالحظات الناذبة عنها. سالسل ادلالحظات اليت تستخد يف تعديل بارام تات النموذج تسمى سالسل التدريب ألهنا تستخد يف تدريب.HMM مسألة التدريب ىي ادلسألة احلامسة يف الكث ت من التطبيقات لنماذج ماركوؼ نظرا ألنو يتيح لنا التكيف األمثل لبارام تات النموذج مع بيانات التدريب ادلالحظة..iii لنفهم الفكرة بشكل أعمق اف تض نظا التعرؼ على الكلمات ادلنفصلة اآليت من أجل كل كلمة من القاموس نريد أف نصمم ظلوذج ماركوؼ منفصل خاص هبا ظلثل اإلشارة الصوتية للكلمة ادلعطاة كسلسلة مرتبطة بالوقت من األشعة الطيفية ادلشفرة. نعترب أف التشف ت يتم من خالؿ Codebook طيفي ب M شعاع طيفي فريد وبالتايلكل مالحظة ىي موقع أو رقم الشعاع األقرب من اؿ Codebook الطيفي اىل اإلشارة االصلية للكال. وىكذا كل كلمة من القاموس ذلا سلسلة تدريب مكونة من رلموعة من سالسل األرقا ادلولدة من اؿcodebook. ادلهمة األوىل ىي بناء ظلاذج منفصلة للكلمات ىذه اخلطوة تتم حبل ادلسألة الثالثة بتقدير القيم ادلمثلة لبارام تاتكل ظلوذجكلمة. يف النهاية عندما يصبح لدينا رلموعة HMM مت تصميمها من أجل كل كلمة يف القاموس بأمثلية ودرست بدقة التعرؼ على كلمة جديدة يتم باستخدا احلل للمسألة األوىل بتسجيل نتيجة ظلوذج كل كلمة باالعتماد على سلسلة ادلالحظات ادلعطاة)الكلمة اجلديدة( وطلتار الكلمة اليت يسجل ظلوذجها االحتمالية األعلى. يف القسم التايل سنقد احللوؿ الرياضية الرمسية لكل مسألة من ادلسائل السابقة ؿ.HMM غلب علينا مالحظة أف ادلسائل الثالث السابقة مرتبطة ببعضها ربت اطار احتمايل. 68

: 2-4-4 حلول المسائل الثالث لنموذج ماركوف المخفي : HMM : 1-2-4-4 حل المسألة األولى [5][3]: نريد حساب احتماؿ سلسلة ادلالحظات O=O 1,O 2, O T بالنسبة للنموذج.P(O λ) λ الطريقة ادلباشرة ادلبسطة للقيا بذلك من خالؿ حسابكل سلسلة حاالت شلكنة بطوؿ T )عدد ادلالحظات(. مثال اف تض سلسلة احلاالت من الشكل: إف احتمالية سلسلة ادلالحظات بالنسبة لسلسلة احلاالت ادلذكورة ربسب بالشكل: ادلعادلة )4-4( : حيث اف تضنا استقاللية احتمالية للمالحظات وبذلك ضلصل على: ادلعادلة )5-4( : احتمالية السلسلة Q من النموذج ؽلكن اف تكتب بالشكل: ادلعادلة )6-4( : االحتماؿ ادلش تؾ ؿO احتماؿ السلسلت ت قد وقعتا يف وقت واحد ىو ببساطة جداء االحتمال ت و Q السابق ت: ادلعادلة )7-4( : 69

إف احتمالية السلسلة O بالنسبة لنموذج ما ضلصل عليها جبمع االحتماؿ ادلش تؾ السابق بالنسبة لكل سالسل احلاالت ادلمكنة من النموذج ادلعطى بطوؿ T: ادلعادلة )8-4( : ولكن باتباع ىذه الطريقة يف احلساب نالحظ أف التعقيد الزم ت من ادلرتبة 2.T.N T لذلك من الواضح أننا ضلتاج إلجراء آخر حلل ىذه ادلشكلة واحلصوؿ على االحتماؿ ادلطلوب. وحلسن احلظ ىذا اإلجراء موجود ربت اسم.Forward-Backward procedure ىذا اإلجراء يعتمد ادلتحوؿ التايل: ادلعادلة )9-4( : ( ) ويعرب ىذا الرمز عن احتماؿ سلسلة جزئية حىت اللحظة O 1 O, 2 O t t واحلالة t عند اللحظة S i باستخدا ىذه الطريقة يصبح حل ادلسألة باخلطوات التالية: 71

اخلطوة : 1 هتيئة ادلتحوؿ α )ادلتحوؿ األمامي( على أنو احلدث ادلش تؾ للحالة S i وادلالحظة البدائية اخلطوة 2 :يتوضح لدينا عملية احلساب األمامية من خالؿ الشكل التايل: O 1 الشكل) 4-4 ( ادلتحوؿ األمامي وعملية احلساب األمامية α T )i( P(O λ) اخلطوة 3 : تعطي االحتماؿ ادلطلوب وذلك جبمع ادلتحوالت األمامية النهائية: من أجل. ونالحظ أنو باستخدا ىذا االجراء يتطلب تعقيد حسايب من ادلرتبة N 2 T فقط. : وبنفس الطريقة ؽلكن تعريف ادلتحوؿ اخللفي (i) β t ادلعادلة )10-4( : يعرب ىذا ادلتحوؿ عن احتماؿ سلسلة ادلالحظات اجلزئية من اللحظة 1+t حىت النهاية دبعرفة احلالة S i يف اللحظة t والنموذج λ ومرة أخرى نستطيع حساب قيمة ادلتحوؿ باتباع اخلطواتكالتايل: 70

1 نستطيع يف النهاية أف نوجد االحتماؿ ادلطلوب حلل ادلسألة 1 من خالؿ صبع ادلتحوالت اخللفية عند اللحظة بالنسبة جلميع احلاالت ادلمكنة. وسنرى الحقا أف ىذا ادلتحوؿ مفيد يف حل ادلسائل 2 و 3 أيضا. : حل المسألة الثانية[ 3][5 ]: 2-2-4-4 توجد عدة طرؽ ؽلكن اتباعها للحصوؿ على سلسلة احلاالت األفضل اليت تالئم سلسلة ادلالحظات ادلعطاة: أوالا : نقو بتعريف ادلتحوؿ : وىو الرمز ادلعرب عن احتماؿ كوف t النظا يف احلالة S i عند اللحظة دبعرفة النموذج وسلسلة ادلالحظات وؽلكن إغلاد قيمة االحتماؿ السابق دبعرفة االحتماالت األمامية واخللفية كالتايل: ( ) ( ) ( ) ( ) ادلعادلة )11-4( : ( ) ( ) ( ) ( ) بينما t S i O 1..O t حيث أف ادلتحوؿ (i) α t يش ت اىل السلسلة اجلزئية عند اللحظة واحلالة t ويتبقى S i O t+1 O T ادلتحوؿ (i) β t يش ت اىل اجلزء ادلتبقي من السلسلة ودبعرفة أف احلالة عند اللحظة عامل التسوية ) ( ) ( ليجعل ادلتحوؿ ادلعرؼ سابقا مقاسا احتماليا حيث: ( ) باستخدا ادلتحوؿ السابق ؽلكننا إغلاد سلسلة احلاالت األفضل بشكل منفرد يفكل حلظة tكالتايل: ادلعادلة )12-4( : 72

على الرغم أف الطريقة السابقة سبكننا من معرفة احلالة الصحيحة ذات االحتماؿ األعظم من أجل كل حلظة لكن ؽلكن أف نواجو بعض ادلشاكل السلسلة ادلتشكلة الناذبة. على سبيل ادلثاؿ ؽلكن أف نواجو احتمالية انتقاؿ من حالة i اىل حالة j معدومة )0= ij A( ويف نفس الوقت قد نواجو احلالة التالية: أف تكوف احلالة ادلثلى يف اللحظة t ىي بذلك ستكوف السلسلة الناذبة هناية خاطئة بشكل منطقي. S i واحلالة ادلثلى يف اللحظةt ىي. S j قد توجد حلوؿ للمشكلة السابقة لكنها لن تكوف ذات فعالية وقد ال ربل ادلشكلة بالنسبة جلميع النماذج ادلتوقع مصادفتها لذلك سنعتمد طريقة ثانية للحل إلغلاد أفضل سلسلة حاالت يف النموذج اعتمادا على سلسلة ادلالحظات. ثانيا: خوارزمية :Viterbi للحصوؿ على أفضل سلسلة حاالت Q بالنسبة للسلسلة O ضلتاج لتعريف الكمية التايل: ادلعادلة )12-4( : ( ) ( ) وتع ت ىذه العالقة إغلاد افضل نتيجة أو اعلى احتمالية على طوؿ سلسلة واحدة عند اللحظة t واليت ربسب من خالؿ أوؿ t مالحظة من O وحبيث تنتهي عند احلالة احلالة األفضل التالية )يف اللحظة 1+t( باستخدا العالقة: ادلعادلة )13-4( : S i يف اللحظة t ونستطيع بالتتابع حساب أي ضلتاج حلساب احلالة ذات أعلى احتمالية من خالؿ تتبع السلسلة اليت مت اغلادىا حىت اللحظة t ونكرر ىذه العملية حىت هناية سلسلة ادلالحظات. الس تداد تسلسل احلاالت األكثر األرجحية غلب علينا متابعة مسار الوسطاء اليت اخ تناىاكقيم أعظمية يف ادلرحلة السابقة من أجلكل حلظة زمنية )t( وكل حالة شلكنة يف النموذج ) j ). 73

إلصلاز ىذه ادلهمة نقو بتعريف ادلصفوفة واالجراء الكامل إلغلاد السلسلة يتبع اخلطوات ادلوضحة يف الشكل التايل : الشكل) 5-4 ( إجراء خوارزمية Viterbi : 3-2-4-4 حل المسألة الثالثة[ 3][5 ] : وىي ادلسألة األكثر صعوبة يف النموذج ىنا نريد ربديد الطريقة لضبط بارام تات النموذج( A,B,π ) لتحقيق أفضل احتماؿ لسلسلة ادلالحظات دبعرفة النموذج. ال توجد طريقة معروفة حلل ربليلي للنموذج من أجل احلصوؿ على متحوالت النموذج اليت تعطي االحتماؿ األمثل لسلسلة ادلالحظات. يف الواقع بإعطاء أي سلسلة مالحظات فإنو ال يوجد طريقة مثلى لتقدير بارام تات النموذج. على أية حاؿ ؽلكننا اختيار البارام تات اليت تعطي احتمالية تكرارية مثل اجراء.[8](Baum-Welch) P(O λ) أمثلية زلليا باستخدا طريقة من أجل وصف اجراء إعادة تعي ت)تقدير( بارام تات النموذج سنعرؼ بداية ادلتحوؿ التايل: 74

ادلعادلة )14-4( : ( ) ( ) وىو احتماؿكوف النظا يف احلالة والسلسلة O. S i عند اللحظة t ويف احلالة S j عند اللحظة 1+t دبعرفة النموذج λ ويبدو واضحا من تعريف ادلتحوالت Forward و Backward أنو ؽلكن كتابة ادلتحوؿ السابق بالشكل التايل: ادلعادلة )15-4( : حيث أف البسط ىو االحتماؿ السابق ذاتو والقسمة على P(O λ) يعطي تقييس االحتماؿ ادلطلوب. كنا قد عرفنا سابقا يف ادلسألة ) 2 ( الرمز الذي يدؿ على احتماؿكوف النظا يف احلالة S i ( و ) اللحظة t ودبالحظة ادلتحوؿ السابق ؽلكننا بشكل واضح إغلاد عالقة ما ب ت ادلتحول ت ) ( كالتايل : ادلعادلة )16-4( : عند ( ) ( ) وجبمع عناصر ادلتحوؿ ) ( وفق عامل الزمن t ضلصل على الكمية ادلعربة عن العدد ادلتوقع دلرات زيارة احلالة S i أو بكلمات أخرى العدد ادلتوقع لالنتقاالت من احلالة S i )باستثناء اللحظة )t=t وبشكل مشابو جبمع عناصر ادلتحوؿ( ( وفق عامل الزمن )باستثناء اللحظة )t=t ضلصل على العدد ادلتوقع لالنتقاالت من احلالة. أي أف: S j اىل احلالة S i 75

باستخدا الصيغ السابقة ؽلكننا اآلف تقد ن طريقة إعادة تعي ت بارام تات HMMكما يلي: رلموعة صيغ إعادة التعي ت ادلنطقية ىي كالتايل: اذا أشرنا إىل النموذج احلايل بالصيغة ) ( واستخدمنا ىذه البارم تات يف احلساب السابق يف اجلهة اليم ت من إشارة ادلساواة وأشرنا إىل النموذج التايل بعد إعادة تعي ت البارام تات بالصيغة ( ) فإنو مت إثبات ما يلي من قبل Baum [ 8 ]وزمالئو: ) 1 إما النموذج األوؿ )احلايل( يشكل نقطة حرجة لتابع التشابو Likelihood ويف ىذه احلالة يكوف. : أي ) 2 أو النموذج اجلديد أكثر أرجحية من النموذج احلايل دبع ت أف أننا وجدنا ظلوذجا جديدا حبيث أنو بالنسبة جملموعة ادلالحظات ادلعطاة فإف احتماؿ توليدىا منو أكرب من احتماؿ توليدىا من النموذج احلايل. 76

باالعتماد على اإلجراء السابق إذا قمنا باستخدا النموذج اجلديد مكاف النموذج احلايل بشكل متكرر وإعادة احلسابات إلعادة تقدير البارام تات فإنو ؽلكننا زيادة احتماؿ مالحظة السلسلة ادلعطاة O من النموذج ونتوقف عند الوصوؿ اىل شرط زلدد مثل عدد تكرارات أعظمي أو فرؽ صغ ت جدا يف األرجحية ب ت النموذج ت احلايل واجلديد. النتيجة النهائية من ىذا اإلجراء تسمى أعظم تقدير احتماؿ لنموذج.HMM غلب أف نش ت اىل أف خوارزمية (Baum-Welch) أو تسمى أيضا Forward-Backward تصل اىل احتماؿ أعظمي زللي( Maxima (Local فقط وىذه من أكثر ادلشاكل اليت هنتم هبا حيث أف سلطط)أو سطح( األمثلية معقد جدا وػلوي الكث ت من النقاط األعظمية زلليا [ 8 ]. احلل األفضل ىنا قد يكوف إعادة تنفيذ اإلجراء عدة مرات وكل مرة نبدأ ببارام تات عشوائية سلتلفة لنصل اىل قيمة عظمى زللية سلتلفة ويف النهاية طلتار النموذج الذي وصل لالحتماؿ األعظمي األفضل. : : أنواع نماذج ماركوف Types of HMMs 5-4 حىت اآلف كنا نف تض حالة خاصة من النماذج HMMs) (fully connected حيث كل حالة يف النموذج ؽلكن الوص وؿ اليها خبطوة واحدة فقط من أي حالة أخرى من ىذا النموذج[ 1 ]. كما ىو موضح بادلثاؿ التايل : من أجل ظلوذج حيث 4=N تكوف مصفوفة االنتقاالت A االنتقاؿكما يف الشكل التايل حيث كل وسلطط a ij ىو عدد موجب ب ت : 1 0 الشكل )6-4( : ظلوذج Fully connected HMM 77